PCX 



iOANISATION MONDIALB DE LA PROPRIETE 
' Bureau mtemationai 





DEMANDE INTERNATIONALE PUBUEE EN VERTU DU TRAITE DE COOPERATION EN MATIERE DE BREVETS (PCT) 



(51) Classification Internationale des brevets 6 : 

C12N 15/48, C07K 14/15, C12Q 1/68, 
C07K 16/10, GOIN 33/569 



Al 



(11) Num^ro de publication intematioiiale: WO 99/02696 

(43) Date de publication internatioiiale: 21 Janvier 1999 (21,01.99) 



(21) Num^ro de la demande Internationale: 'PCT/FR98/01442 

(22) Date de d^pdt international: 6 juillet 1998 (06.07.98) 



(30) Donn^cs relatives h la prioritd: 

97/08815 7 juillet 1997 (07.07.97) FR 



(71) DIposant (pour tous les Etats disignes sauf US)i BIO 

MERIEUX [FR/FR]; Clicmin de I'Onne, F-69280 Marcy 
TEtoile (FR). 

(72) Inventeiirs; et 

(75) Inventeurs/Ddposants (US seutement): BESEME, Fr6d6ric 
[FR/FR]; 39. rue de la Noycra, F-38090 ViUefontaine (FR). 
BLOND, Jean-Luc [FR/FR]; 75 bis, nie des Acqueducs. 
F^005 Lyon (FR). BOUTON, Olivier [FR/FR]; 48. av- 
enue du Chater. F-e9340 Franchevillc (FR). MANDRAND, 
Bemaid [FR/FR]; 21, rue de la Doua. F-^100 Villeurbanne 
(FR). MALLET, Francois [FR/FR]; 84. me Anatole France, 
F-69100 Villeurbanne (FR). 

(74) Mandataire: CABINET GERMAIN & MAUREAU; B<^te 
postale 6153. F-69466 Lyon Cedex 06 (FR). 



(81) Etats d^ign^i: AL, AM, AT, AU, AZ. BA. BB. BG, BR. BY. 
CA. CH. CN. CU, CZ, DE. DK. EE. ES, FI, GB. GE, GH, 
GM, GW. HR, HU, ID. IL, IS. JP. KE, KG. KP, KR. KZ, 
LC. LK, LR. LS, LT, LU, LV, MD, MG. MK, MN, MW, 
MX, NO, NZ, PL, PT, RO, RU. SD. SE, SG, SI, SK, SL, 
TJ, TM, TO, TT, UA, UG. US, UZ, VN, YU, ZW, brevet 
ARIPO (GH, GM, KE, LS, MW, SD, SZ, UG, ZW), brevet 
eurasien (AM, AZ, BY, KG. KZ, MD, RU, TJ, TM), brevet 
europ^en (AT, BE, CH, CY, DE, DK, ES, FI, FR, GB, GR, 
IE, IT, LU, MC, NL. PT, SE), brevet OAPI (BF. BJ, OF, 
CG. CI, CM. GA. GN, ML, MR, NE. SN. TD, TG). 



Publi^e 



Avec rapport de recherche internationaU, 
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NANCY DISORDERS 

(54) Titre: SEQUENCES RETOOVIRAUX ENDOGENES. ASSOCIEES A DES MALADIES AUTO-IMMUNES ET/OU A DES 
PERTURBATIONS DE LA GROSSESSE 

(57) Abstract 

The invention concerns a genomic retroviral nucleic material, in isolated or purified state, at least partially functional or non-functional, 
whereof flie genome comprises a reference nucleotide sequence selected from the group including sequences SEQ ID N^^: I to 15, their 
complementaiy sequences, and their equivalent sequences, in particular the nucleotide sequences having, for every series of 100 contiguous 
monomers, at least 70 % and preferably at least 90 % homology with said sequences SEQ ID N«: 1 to 15, The invention also concerns 
the application of said material. 



(57) Xhr6g€ 

LMnvention conceme un materiel nucl£ique de type g^nomique retroviral. ^ Tdtat isol6 ou purifi6. au moins partiellement fonctionnel 
ou non fonctionnel. dont Ic g6nome comprend une sequence nucl«otidique de r6f6rence choisie dans le groupe incluant les s6quences SEQ 
ID NOs: 1 & 15. leurs s6quences compl6mentaires, et leurs s6quences ^uivalentes, notamment les sequences nucMotidiques pr6sentant, 
pour toute suite de 100 monom&res contigus, au moins 70 % ct pr6f6rentiellement au moins 90 % d*homoIogie avec respectivement lesditcs 
sequences SEQ ID NOs: 1 & 15; et les applications de ce mat^el. 
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SEQUENCES RETROVIRAUX ENDOGENES, ASSOCIEES A DES MALADffiS AUTO-IMMUNES 
ET/OU A DES PERTURBATIONS DE LA GROSSESSE 



5 La presents invention concerne un nouveau materiel 

nucl^ique, de type genomique retroviral endogSne, 
diffferents fragments nucleotidiques qui le comprennent ou 
qui sont obtenus a partir dudit materiel, ainsi que leur 
utilisation pour marquer au luoins une maladie auto- immune, 

10 ou une pathologie qui lui est associee, une grossesse 
pathologique ou un insucces de grossesse. 

Le criblage de la" banque d'ADNc ^ I'aide de la 
sonde Ppol-MSRV (SEQ ID NO: 29) a permis de d§tecter des 
clones chevauchant permettant la reconstruction d'un ARN 

15 genomique putatif de 7582 nucleotides. - Par sequence 
reconstruite , on entend la sequence d§duite de 
1 • alignement des clones chevauchants Cet ARN genomique 
pr^sente la structure R-U5-gag-pol-env-U3-R. Une 
interrogation "blastn" sur plusieurs bases de donnees, a 

20 I'aide du genome reconstruit, montre qu'il existe une 
quant ite importante de sequences genomiques (ADN) 
apparentees dans le genome humain. Environ 4 00 sequences 
ont et6 identifiees dans GenBank (cf figure 3) et plus de 
200 sequences dans la banque EST (Expressed Sequence Tag) , 

25 la plupart en antisens. Ces sequences sont trouv6es sur 
plusieurs chromosomes, notamment les chromosomes 5, 7, 14, 
16, 21 > 22, X, avec une forte concentration apparent e de 
LTR sur le chromosome X. 

La sequence reconstruite (ARNm) est contenue 

30 intfegralement a I'intferieur du clone genomique RG083M05 
(gb AC00064) (9,6 kb) , et presente une similitude de 96% 
avec deux regions discontinues de ce clone qui contient 
egalement des regions rep^tees a chaque extremite. 
L* alignement des sequences experimentales correspondant 

35 aux regions 5* et 3 • de I'ARN genomique reconstruit avec 
I'ADN du clone RG083M05 a permis de deduire une sequence 
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LTR et d' identifier des Elements caracteristiques des 
retrovirus notamment ceux impliqu^s dans la transcription 
inverse, a savoir le PBS (Primer Binding Site) en aval du 
LTR 5' et le PPT (PolyPurine Tract) en amont du LTR 3'. on 
5 observe que !• element U3 est extremement court en 
comparaison de celui observe chez les retrovirus de type C 
des mammif eres, et comparable en taille a la region U3 
generalement decrite chez les retrovirus de type D et les' 
retrovirus aviaires. La region PBS est homologue au PBS 

10 des retrovirus aviaires, suggerant 1 • utilisation du 
tRNA^^^P comme amorce pour la transcription inverse. Par 
consequent, cette nouvelle famille de HERV est nommee 
HERV-W (Human Endogenous Retrovirus) . 

L* analyse phylogenique dans la region pol a montre 

15 que la famille HERV-W est phylog^niquement liee aux 
families ERV-9 et RTVL-H, et appartient done k la famille 
des retrovirus endogenes de type I. L' analyse 
phylogenetiG[ue de la trame de lecture ouverte (ORF) de env 
montre qu'elle est plus proche des retrovirus simiens de 

2 0 type D et des retrovirus de la reticuloendotheliose 
aviaire que des retrovirus mammif eres de type C, suggerant 
une structure de genome chimerique C/D, 

Les arbres phylogeniques , supportes par des hautes 
valeurs de "bootstrap" montrent que les families ERV-9 et 

25 HERV-W derivent de deux vagues d» insertions independantes . 
Ainsi, le(s) element (s) actif(s) a I'origine de la famille 
HERV-W est (sont) distinct (s) de celui (ceux) 
du (des) quel (s) la famille ERV-9 derive. De plus, le PBS de 
HERV-W utilise probablement un tRNA^rp alors que ERV-9 

30 utilise probablement un tRNAArg. 

Enfin, les membres de la famille HERV-W sont 
exprim^s dans le placenta, alors qu'on ne d^tecte pas les 
ARN ERV-9 dans ce tissu. 

35 
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FONCTIONS BIOLOGIQUES DE HERV-W 

L' expression de HERV-W restreint:e au placenta et 
la longue tiraxne de lecture codant potentiellement pour une 
enveloppe retrovirale autorisent It proposer des fonctions 
5 biologigues physiologiques dont 1' alteration pourrait dtre 
associ^e S des pathologies. 

L* expression restreinte au placenta suggere que 
1* expression de gdnes retroviraux et/ou non retroviraux 
sous la dependance des LTR peut etre hormone-dependante . 
> 10 Ces genes peuvent etre adjacents, ou sous la dependance de 

IjTR isoles. Une pathologie peut alors provenir d'une 
expression aberrante suite a la reactivation d'un LTR 
silencieux par divers facteurs : infection virale (par 
exemple par un membre de la f ami lie des Herpesvirus) ou 

15 activation immune locale. Un polymorphisme au niveau des< ^ 
LTR pourrait aussi favoriser ces ev^nements. ? . 

L' enveloppe de HERV-W pourrait jouer un role 
fusogenique, en particulier au niveau de sous-types^ ? 
cellulaires du placenta. Le peptide immunosuppresseur de 

20 cette enveloppe pourrait proteger le foetus centre 
l*agression du systeme imrounitaire maternel. Enfin, par un 
mecanisme de saturation de recepteurs, 1* enveloppe de 
HERV-W pourrait jouer un role protecteur centre les 
infections retrovirales exogenes . L' alteration de 

25 I'immunite cellulaire locale peut decouler d*un signal 
immunostiinulateur porte par 1» enveloppe. Get effet peut 
Stre lie h. une region portant une activity superantig^ne, 
ou g la region immunosuppressive qui deviendrait 
immunostimulatrice a la suite, soit d'un polymorphisme, 

30 soit d*un effet-dose (surexpression) . 

La verification de ces implications et la 
comprehension des consequences li^es ^ une alteration des 
fonctions biologiques des LTR ou de 1 • enveloppe 
retrovirale endogenes peut mener a 1 *etablissement de 

35 methodes de diagnostic ou de suivi : 
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- d * 6tats de grossesse pa-khologique ou d ' insucces 
de grossesse, 

- de maladies auto-immunes comme la sclerose en 
plaques ou la polyarthrite rhumatolde. 

5 Conf ormement h la prSsente invention, il a ete 

decouvert, a I'etat endogene, un nouveau materiel 
nucleique, explicite et deer it ci-apr^s, ayant 
1 ' organisation d»un retrovirus, et susceptible d'etre 
correle a una maladie auto-immune, ou une pathologie qui 

10 lui est associee, a une grossesse pathologique ou un 
insucces de grossesse. 

Le materiel nucleique selon la presents invention, 
sous forme ARNm, represente environ 8 Kb, il est 
represents a la Figure 1 et est deer it par SEQ ID NO: li, 

15 et est represente a la Figure 2 sous forme d'ADN 
genomique . 

Par 1« expression "de type retroviral", on entend 
la caracteristique selon laquelle le materiel nucleique 
consider^ comprend une ou des sequences nucleotidiques 

20 apparentees ei 1 'organisation d'un retrovirus, et/ou a ses 
sequences f onctionnelles ou codantes. 

Ce materiel nucleique de reference s*apparente a 
un retrovirus endogene humain, designe par !• expression 
HERV-W. En consequence, il peut etre obtenu par toute 

25 technique appropriee de balayage ("screening") de toute 
bangue d'ADN humain, ou d»ADNc placenta ire, comme montre 
ci-apres, en particulier avec des amorces ou sondes 
nucieiques synthetisees pour s'hybrider avec tout ou 
partie de SEQ ID NO: 11. 

30 La presente invention concerne egalement tout 

produit nucleique ou peptidique, obtenu ou derive a partir 

du materiel nucleique de reference, selon SEQ ID NO: 11. 

♦ 

Et 1' invention s'interesse pour terminer aux 
differentes correlations pouvant etre faites entre le 
35 materiel nucleique precite, et/ou ses produits derives, 
avec toute maladie auto-immune et/ou une pathologie qui 
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lui est associee, ainsi qu'avec des cas de grossesse 
pathologique ou d'insucces de grossesse. 

Par dite »• auto- immune " , on entend notamment : 

- la sclerose en plaques 

5 - la polyarthrite rhumatoide 

- le lupus 6ryth^mateux diss^min^ 

- le diabete insulino-d^pendant 

- et/ou les pathologies qui leur sont associees. 

10 \^ La presents invention concerne tout d • abord un 

materiel nucleique de type genomique retroviral, a 1 • etat 
isole ou purifie, au moins partiellement fonctionnel ou 
non fonctionnel. 

Ce materiel est caracterise en ce que son genome 

15 comprend une sequence nucleotidique de r6f6rence choisie 
dans le groupe incluant les sequences SEQ ID NOs: 1 ^ 15>-^ 
leurs ' sequences complement a ires, et leurs sequences l. 
equivalentes, notamment les sequences nucleotidiques 
presentant, pour toute suite de 100 monomeres contigus, au ' 

20 moins 50% et pref ^rentiellement au moins 70%, par exemple 
au moins 90% d*homologie avec respectivement lesdites 
sequences SEQ ID NOs: 1 a 15. 

Ce materiel est egalement caracterise en ce que 
son genome comprend une sequence nucleotidique de 

25 reference, codant pour tout polypeptide presentant, pour 
toute suite contigiie d'au moins 3 0 acides amines, au moins 
50%, et de preference au moins 70% d'homologie avec une 
sequence peptidique susceptible d'etre cod^e par au moins 
une partie f onctionnelle de la sequence nucleotidique de 

30 reference telle que d§finie ci-dessus. 

A titre particulier, ce materiel comprend un 
fragment nuclfeique insferfe entre deux sequences 
correspondant respectivement a la region LTR et au gSne 
gag de la structure genomique r^trovirale, notamment un 

35 fragment nucleique const ituS par ou comprenant la sequence 
SEQ ID NO: 12. 
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L' invention concerne aussi un materiel nucleique 
de type retroviral sous-genomique, constitue par une 
sequence nucleotidique identique a SEQ ID NO: 11, avec une 
deletion tel qu« exempli fie par les clones cl.PH74 
5 (SEQ ID NO: 7), cl . PH7 (SEQ ID NO: 8) et cl.PiST 
(SEQ ID NO: 9), cette deletion resultant . ou non d'une 
strategie d'epissage. 

Le materiel nucleique precedemment d6f ini comprend 
au moins une sequence nucleotidique f onctionnelle codant 
10 pour au moins une proteine retrovirale, et/ou au moins une 
sequence nucleotidique de regulation. 

L* invention concerne ensuite tout fragment 
nucleotidique d'au moins 100 bases, comprenant une 
sequence nucleotidique choisie dans le groupe comprenant : 

a) toutes les sequences nucleotidiques, partielles 
et totales d • un materiel nucleique tel que def ini 
pr€cedemment 

b) toutes les sequences nucleotidiques, partielles 
et totales d"un clone choisi dans le groupe incluant les 

20 clones : 





cl. 


6A2 


(SEQ 


ID 


NO 


' 1) 




cl. 


6A1 


(SEQ 


ID 


NO 


: 2) 




cl. 


7A16 


(SEQ 


ID 


NO 


• 3) 




cl. 


Pi22 


(SEQ 


ID 


NO 


: 4) 




cl. 


24.4 


(SEQ 


ID 


NO: 


: 5) 




cl. 


C4C5 


(SEQ 


ID 


NO; 


: 6) 




cl. 


PH74 


(SEQ 


ID 


NO; 


I 7) 




cl. 


PH7 


(SEQ 


ID 


NO: 


: 8) 




cl. 


Pi5T 


(SEQ 


ID 


NO: 


: 9) 




cl. 


44.4 


(SEQ 


ID 


NO: 


: 10) 




HERV-W 


(SEQ 


ID 


NO: 


11) 




cl. 


6A5 


(SEQ 


ID 


NO: 


12) 




cl. 


7A20 


(SEQ 


ID 


NO: 


13) 




cl. 


7A21 


(SEQ 


ID 


NO: 


14) 




LTR 


(SEQ 


ID 


NO: 


15) 
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c) les sequences respect ivement complementaires 
aux sequences selon a) et b) 

d) les sequences respect ivement 6quivalentes aux 
sequences selon a) ^ c) , notamment les sequences 

5 nucleotidiques presentant, pour toute suite de 100 
monomdres contigus, au moins 50%, et de preference au 
moins 70%, ou mieux au moins 80 %, par exemple au moins 
90% d'homologie avec les sequences a) ^ c) . 

L' invention concerne aussi toute sonde nuclSique 

10 de detection d'un materiel nucleique, insere ou non dans 
un acide nucleique, caracterisee en ce qu'elle est 
susceptible de s'hybrider specif iquement sur un materiel 
nucleique, tel que defini precedemment . 

Une telle sonde comprend ou non un marqueur. ^• 

15 L* invention concerne aussi une amorce nucleique 

pour 1" amplification par polymerisation d'un ARN ou d'un 
ADN, caracterisee en ce qu»elle comprend une sequence^ 
nucleotidique susceptible de s'hybrider specif iquement sur 
un materiel nucleique ou un fragment nucleique, tel que 

20 defini precedemment. 

A titre d' exemple, une sonde nucleique ou amorce 
nucleique selon 1» invention est caracterisee en ce qu'elle 
est constitute par une sequence nucleotidique choisie dans 
le groupe incluant SEQ ID NOs: 16 a 28. 

25 L» invention concerne aussi tout ARN ou ADN, et 

notamment un vecteur de replication, comprenant un 
fragment nucleotidique, tel que defini precedemment. 

L» invention concerne aussi tout peptide code par 
tout cadre de lecture ouvert appartenant S un fragment 

30 nucleotidique, tel que defini precedemment, notamment 
polypeptide, par exemple oligopeptide formant un 
determinant antigenique reconnu par des sera de patients 
affectes par une maladie auto-immune, ou une pathologie 
qui lui est associee, ou de patientes ayant une grossesse 

35 pathologique ou un insuccSs de grossesse. 
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A titre d'exemple, ce polypeptide est cod6 par un 
fragment nucl^otidique comprenant un cadre de lecture 
ouvert codant pour une ou des proteines ENV retrovirales. 

Enfin, 1 • invention concerne : 
5 - 1 'utilisation d»un materiel nucleique, ou d'un 

fragment nucleotidique, ou d»un peptide defini ci-dessus, 
tels que definis precedemment , comme marqueur moleculaire 
d'une maladie auto-immune ou d»une pathologic qui lui est 
associee, de grossesse pathologique ou d'insucc^s de 
10 grossesse ; 

- 1 » utilisation d'un materiel nucleique, ou d'un 
fragment nucleotidique , tels que definis precedemment, 
comme marqueur chromosomique d*une susceptibilite a une 
maladie auto-immune ou d'une pathologie qui lui est 

15 associee, ou d*un risque d'une grossesse pathologique ou 
d'un insucc^s de grossesse ; 

- 1« utilisation d'un materiel nucleique, ou d'un 
fragment nucleotidique, tels que definis precedemment, 
comme marqueur de proximity d'un gene de susceptibilite a 

20 une maladie auto-immune ou a une pathologie qui lui est 
associee, ou a un risque d'une grossesse pathologique ou 
d'un insucces de grossesse. 

L' invention concerne aussi un precede de marquage 
moleculaire d'une maladie auto-immune ou d'une pathologie 

25 qui lui est associee, de grossesse pathologique ou 
d*insuccds de grossesse, caracteris^ en ce qu'on identifie 
et/ou quantifie dans tout materiel biologique corporel, 
notamment fluide corporel, tout fragment nucleotidique, 
tel que defini pr#c§demment , soit sous forme d'ARN, soit 

30 sous forme d'ADN. 

A titre d'exemple, selon un tel proc€de, on 
d€tecte dans ledit materiel biologique corporel, des 
cellules exprimant un fragment nucleotidique, tel que 
defini precedemment - 

35 L' invention concerne une application diagnostique 

et/ou therapeutique d'un materiel nucleique, d'un fragment 
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nucl^otidigue ou d'un peptide d^fini ci-dessus, et en 
cela, un autre objet de 1 ' invention est une composition 
diagnostique ou une composition therapeutique comprenant 
undit materiel, undit fragment ou undit peptide. 

5 

Avant de detainer !• invention, diff^rents termes 
utilises dans la description et les revendications sont a 
present definis: 

~ par virus humain, on entend un virus susceptible 
10 d»infecter ou d'etre heberge par 1 * etre humain, 

- compte tenu de toutes les variations et/ou 
recombinaisons naturelles ou induites, pouvant etre 
rencontrees dans la pratique de la pr^sente invention, les 
objets de cette derniere, definis ci-dessus et dans les 

15 revendications, ont 6t6 exprim^s en comprenant les 
Equivalents ou derives des diff brents mater iels 
biologiques definis ci-apres, notamment les sequences 
homologues nucleotidiques ou peptidiques, 

- le variant d»un virus ou d'un agent pathogfene 
20 et/ou infectant selon 1' invention comprend au moins un 

antigene reconnu par au moins un anticorps dirige contre 
au moins un antigene correspondant dudit virus et/ou dudit 
agent pathogdne et/ou infectant, et/ou un genome dont 
toute partie est d^tectee par au moins une sonde 

25 d •hybridation, et/ou au moins une amorce d » amplification 
nucleotidique spEcifique dudit virus et/ou agent pathogene 
et/ou infectant, notamment un genome appartenant a la 
famine HERV-W, dans des conditions d'hybridation 
d^termin^es bien connues de I'homme de l"art, 

30 - selon 1' invention, un fragment nucleotidique ou 

un oligonucleotide ou un polynucleotide est un 
enchalnement de monomdres, ou un biopolymdre, caract^risE 
par la sequence, inf ormationnelle ou non, des acides 
nucleiques naturels, susceptible de s'hybrider a tout 

35 autre fragment nucleotidique dans des conditions 
pr^determinees, 1 'enchalnement pouvant contenir des 
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monomeres de structures chimiques diff^rentes et etre 
obtenu a partir d'une molecule d'acide nucleique naturelle 
et/ou par recombinaison genfetique et/ou par synthese 
chimique ; un fragment nucl^otidique peut etre identique a 
5 un fragment gcnomique d»un element de la famille HERV-W 
considere par la presente invention, notamment un gene de 
ce dernier, par exemple pol ou env dans le cas dudit 
element ; 

ainsi un monomere peut etre un nucleotide 

10 naturel d'acide nucleique, dont les elements const itut if s 
sont un Sucre, un groupement phosphate et une base azotee; 
dans I'ARN le sucre est le ribose, dans I'ADN le sucre est 
le desoxy-2-ribose; selon qu'il s'agit de I'ADN ou I'ARN, 
la base azotee est choisie parmi 1» adenine, la guanine, 

15 I'uracile, la cytosine, la thymine; ou le nucleotide peut 
dtre modifie dans I'un au moins des trois Elements 
constitutifs ; a titre d» exemple, la modification peut 
intervenir au niveau des bases, gen^rant des bases 
modifiees telles que I'inosine, la m§thyl-5- 

20 desoxycytidine, la desoxyuridine , la 

dimethylamino-5-desoxyuridine, la diamino-2 , 6-purine, la 
bromo-5 -desoxyuridine et toute autre base modifiee 
favorisant 1 'hybridation; au niveau du sucre, la 
modification peut consister dans le remplacement d'au 

25 moins un desoxyribose par un polyamide, et au niveau du 
groupement phosphate, la modification peut consister dans 
son remplacement par des esters, notamment choisis parmi 
les esters de diphosphate, d'alkyl et arylphosphonate et 
de phosphorothioate, 

30 - par "fonctionnel", on entend la caract^ristique 

selon laquelle une sequence nucleotidique, un materiel 
nucleique, ou un fragment nucleotidique comprend une "une 
sequence inf ormationnelle" , 

- par "sequence inf ormationnelle" , on entend toute 

35 suite ordonn§e de monomeres, dont la nature chimique et 
I'ordre dans un sens de reference, constituent ou non une 
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information f onctionnelle de meme quality que celle des 
acides nucleiques naturels, par exemple une trame de 
lecture. codant pour une prot^ine, une sequence 
regulatrice, un site d'^pissage, un site de recombinaison. 
5 - par hybridation, on entend le processus au cours 

duquel, dans des conditions operatoires appropriees, 
notamment de stringence, deux fragments nucl€otidiques, 
ayant des sequences suffisamment compl Omenta ires, 
s'apparient pour former une structure complexe, notamment 
10 double ou triple, de preference sous forme d*helice, 

- une sonde comprend un fragment nucleotidique 
synthetise notamment par voie chimique ou polymerisation, 

• ou obtenu par digestion ou coupure enzymatique d'un 
fragment nucleotidique plus long, comprenant au moins six - 

15 monomeres, • avantageusement de 10 ^ 100 monomeres, de 
pr^f^rence 10 a 30 monomeres, et poss^dant une specif icite 
- d •hybridation dans des conditions d^terminees ; de 
pr^f^rence, une sonde poss^dant moins de 10 monomeres 
n*est pas utilis^e seule, mais l»est en presence d'autres 

20 sondes de -taille aussi courte ou non ; dans certaines 
conditions particulieres, il peut etre utile d'utiliser 
des sondes de taille superieure a 100 monomeres ; une 
sonde peut notamment etre utilis^e a des fins de 
diagnostic et il s'agira par exemple de sondes de capture 

25 et/ou de detection, 

- la sonde de capture peut etre immobilis^e sur un 
support solide par tout moyen approprie, c'est-a-dire 
directement ou indirectement , par exemple par covalence ou 
adsorption passive, 

30 - la sonde de detection peut ^tre marquee au moyen 

d'un marqueur choisi notamment parmi les isotopes 
radioactifs, des enzymes notamment choisis parmi la 
peroxydase et la phosphatase alcaline et ceux susceptibles 
d'hydrolyser un substrat chromogene, fluorigene ou 

35 luminescent, des composes chimiques chromophores , des 
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composes chromogdnes , fluorigfenes ou luininescents, des 
analogues de bases nucl^otidiques, et la biotine, 

- les sondes utilis^es a des fins de diagnostic de 
1 ' invention peuvent #tre mises en oeuvre dans toutes les 

5 techniques d • hybridation connues de I'homme de I'art, et 
notaiment les techniques dites "DOT-BLOT", "SOUTHERN 
BLOT", "NORTHERN BLOT" qui est une technique identique a 
la technique "SOUTHERN BLOT" mais qui utilise de I'ARN 
comine cible, la technique SANDWICH; avantageusement , on 

10 utilise la technique SANDWICH dans la presente invention, 
comprenant une sonde de capture specifique et/ou une sonde 
de detection specifique, etant entendu que la sonde de 
capture et la sonde de detection doivent presenter une 
sequence nucleotidique au moins partiellement differente, 

15 - toute sonde selon la presente invention peut 

s'hybrider in vivo ou in vitro sur I'ARN et/ou sur I'ADN, 
pour bloquer les phenomdnes de replication, notamment 
traduction et/ou transcription, et/ou pour degrader ledit 
ADN et/ou ARN, 

20 - une amorce est une sonde comprenant au moins six 

monomer es, et avantageuseroent de 10 a 30 monomdres, 
possedant une specif icite d » hybridation dans des 
conditions determinees, pour 1* initiation d'une 
polymerisation enzymatique, par exemple dans une technique 

25 d» amplification telle que la PCR (Polymerase Chain 
Reaction), dans un precede d ' elongation, tel que le 
sgquen^age, dans une m^thode de transcription inverse ou 
analogue , 

- deux sequences nucl^otidiques ou peptidiques 
30 sont dites ^quivalentes ou deriy^es I'une par rapport a 

!• autre, ou par rapport a une sequence de reference, si 
f onctionnellement les biopolymeres correspondants peuvent 
jouer sensiblement le meme role, sans etre identiques, 
vis-a-vis de 1 ' application ou utilisation consider^e, ou 
35 dans la technique dans laquelle elles interviennent ; sont 
notamment equivalentes deux sequences obtenues du fait de 
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. la variabilite naturelle au sein d'un meme individu, ou de 
la diversity naturelle d'un individu a un autre au sein 
d'une mSme espece, notamment mutation spontanee de 
l*espdce a partir de laquelle elles ont ete identifi^es, 
5 ou induite, ainsi que deux sequences homologues/ 
1 • homologie etant d^finie ci-aprfes, 

- par "variability", on entend toute modification, 
spontanee ou induite d*une sequence, notamment par 
substitution, et/ou insertion, et/ou deletion de 

10 nucleotides et/ou de fragments nucleotidiques, et/ou 
■ extension et/ou raccourcissement de la sequence a l^une au 
moins des extremites; une variabilite non naturelle peut 
resulter des techniques de genie genetique utilisees, par 
exemple du choix des amorces de synthese, degenerees ou-^' 

15 non, retenues pour amplifier un acide nucleique; cette * 
variabilite peut se traduire par des modifications de 
. toute sequence de depart, consider^e comme reference, et tr i 
pouvant ' €tre exprim4es par un degre d'homologie par /^ I 
rapport S ladite sequence de r^f^rence, 

20 - I'homologie caracterise le degr^ d' identity de 

deux fragments nucleotidiques ou peptidiques compares ; 
elle se mesure par le pourcentage d'identite qui est 
notamment determine par comparaison directe de sequences 
nucl^oditiques ou peptidiques, par rapport a des sequences 

25 nucleotidiques ou peptidiques de reference, 

- ce pourcentage d'identite a ete specif iquement 
determine pour les fragments nucleotidiques, notamment 
clones relevant de la presente invention, et provenant 
d*un meme individu; a titre d^exemple non limitatif, le 

30 plus faible pourcentage d'identite observe entre les 
differents clones d*un meme individu (cf SEQ ID NOs: 13 et 
14) est d*au moins 90% et le plus faible pourcentage 
d'identite observe entre les differents clones de deux 
individus est d'au moins 80%, 

35 - tout fragment nucieotidique est dit equivalent 

ou derive d'un fragment de reference, s'il presente une 
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sequence nucl^otidique equivalente S la sequence du 
fragment de r^f^rence ; selon la definition precedente, 
sont notamment equivalents a un fragment nucl^otidique de 
reference : 

5 (a) tout fragment susceptible de s'hybrider au 

TOoins partiellement avec le complement du fragment de 
reference, 

(b) tout fragment dont I'alignement avec le 
fragment de reference conduit a mettre en evidence des 

10 bases contigues identiques, en nombre plus important 
qu^avec tout autre fragment provenant d'un autre groupe 
taxonomique, 

(c) tout fragment resultant ou pouvant resulter de 
la variabilite naturelle au sein d'un meme individu, et de 

15 la diversite naturelle d'un individu a un autre dans la 
meme espdce, a partir desquels il est obtenu, 

(d) tout fragment pouvant resulter des techniques 
de genie g^nfetique appliquees au fragment de reference, 

(e) tout fragment, coroportant au moins huit 
20 nucleotides contigus, codant pour un peptide homologue ou 

identique au peptide code par le fragment de reference, 

(f) tout fragment different du fragment de 
reference, par insertion, deletion, substitution d»au 
moins un monomere, extension, ou raccourcissement a I'une 

25 au moins de ses extremit^s ; par exemple, tout fragment 
correspondant au fragment de reference, flanque a I'une au 
moins de ses extr^mites par une sequence nucleotidique ne 
codant pas pour un polypeptide, 

- par sequence nucleotidique, partielle ou totale, 
30 d»un materiel nucl6ique de reference, on entend dgalement 

toute sequence associee par co-encapsidation, ou par 
coexpression, ou recombinee avec ledit materiel nucl^ique 
de reference, 

- par polypeptide, on entend notamment tout 
35 peptide d«au moins deux acides amines, notamment 

oligopeptide, prot^ine, extrait, s^pare, ou 
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' substantiellement isole ou synthetise, par 1 ' intervention 
de la main de I'hoiame, notamment ceux obtenus par synthese 
chimique, ou par expression dans un organisme recombinant, 

- par polypeptide code de maniere partielle par un 
5 fragment nucleotidique, on entend un polypeptide 

pr^sentant au moins trois acides amines codes par au moins 
neuf monomeres contigus compris dans ledit fragment 
nucleotidique, 

- un acide amine est dit analogue S un autre acide 
10 amine, lorsque leur caracteristiques physico-chimiques 

respectives, telles que polarite, hydrophobicite, et/ou 
basicite, et/ou acidite, et/ou neutrality, sont 
sensiblement les memes ; ainsi, une leucine est analogue a 
une isoleucine, 

15 - tout polypeptide est dit equivalent ou d^riv^ 

d'un polypeptide de reference, si les polypeptides 
compares ont sensiblement les memes propri^tes, et 
notamment les m§mes proprifet^s antig^niques; 

immunologiques , enzymologiques et/ou. de reconnaissance 

20 mol^culaire ; est notamment Equivalent a un polypeptide de 
reference : 

(a) tout polypeptide possedant une sequence dont 
au moins un acide amine a 6te substitue par un acide amine 
analogue, 

25 (b) tout polypeptide ayant une sequence peptidique 

equivalente, obtenue par variation naturelle ou induite 
dudit polypeptide de r6f6rence, et/ou du fragment 
nucleotidique codant pour ledit polypeptide, 

(c) un mimotope dudit polypeptide de r^f^rence, 

30 (d) tout polypeptide dans la sequence duquel un ou 

plusieurs acides amines de la sErie L sont remplacEs par 
un acide amine de la sErie D, et vice versa, 

(e) tout polypeptide dans la sequence duquel on a 
introduit une modification des chaines laterales des 

35 acides amines, telle que par exemple une acetylation des 
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fonctions amines, une carboxylation des fonctions thiol, 
une esterif ication des fonctions carboxyliques, 

(f) tout polypeptide dans la sequence duquel une 
ou des liaisons peptidiques ont modifiees, comme par 

5 exemple les liaisons carba, retro, inverse, r^tro- inverse, 
reduites, et m§thyldne-oxy , 

(g) tout polypeptide dont au moins un antigene est 
reconnu par un anticorps dirige. contre un polypeptide de 
reference, 

0 - le pourcentage d'identite caracterisant 

I'homologie de deux fragments peptidiques compares est 
selon la presents invention d'au moins 80% et de 
preference au moins 9 0%. 



^5 Les expressions d*ordre utilisees dans la presente 

description et les revendications, telles que "premiere 
sequence nucleotidique" ne sont pas retenues pour exprimer 
un ordre particulier, mais pour d^finir plus clairement 
1 • invention . 

20 Par detection d*une substance ou agent, on entend 

ci-apres aussi bien une identification, qu'une 
quantification, ou une separation ou isolement de ladite 
substance ou dudit agent. 

25 L' invention sera mieux comprise a la lecture de la 

description detaillee qui va suivre faite en reference aux 
Figures annex^es dans lesquelles : 

- la Figure l represente, d'une part, 
1 ' organisation du materiel retroviral endogene d^couvert 

30 selon la presente invention, sous la forme d'un ARNm 
g^nomique putatif , et, d'autre part, la localisation des 
clones raise en oeuvre selon la presente invention, par 
rapport a cette organisation; les echelles de longueur 
sont exprimees en Kb ; les regions flanquantes (5» UTR et 

35 3« UTR) sont indiqu6es dans des boites hachurfees ; les 
regions rep6tees dans ces deux regions flanquantes sont 
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indiquees par des f leches noires ; les regions 
correspondant aux genes gag, pol, et env, sont indiques 
respectivement, en noir, blanc et gris ; le positionnement 
de la sonde Ppol-MSRV est indiqu^ ; 
5 - la Figure 2 represente une possibilite 

d» organisation g6n§tique (ADN) , iliustr€e par le clone 
RG083M05, et une strategie d"epissage liant a cette 
sequence, les clones experimentaux (ARNin) ; cette figure 
itiontre egalement les sites d'epissage observes par 
10 r^f^rence a 1 • organisation r^trovirale ; sur cette figure 
sont en outre indiques : 

la localisation des sondes utilisees (Pgag-LB19, 
Ppro-E, Ppol-MSRV et Penv-C15) ; 

les sites donneurs (DSl et DS2) et accepteurs (ASl 
15 a AS3) d*epissage ; 

les sequences provenant du clone RG083M05, dans 
les boites en minuscules, et les sequences d^rivant des 
clones experimentaux placenta ires (ARNm) , dans les boites 
en majuscule ; 

20 les ORFs putatives (ORFl, ORF2 et ORF3) ; et 

un insert de 2 Kb present sous forme ADN mais non 
detects sous forme ARN, represents sous forme de hachures 
verticales« 

Les autres conventions utilisees dans cette figure 
25 sent les memes que celles de la Figure 1. 

- la Figure 3 donne une representation de clones 
genomiques (ADN) correspondant aux clones d'ADNc isoles ; 
sur cette figure, sont indiques : 

le pourcentage de similitude vis-&-vis de I'ARN 
30 g^nomique reconstruit (ARM Recons) ; 

la presence de sequences repetees a chaque 
extremity de ces genomes (repetitions) ; et 

la presence et la taille des trames de lecture 
ouverte (ORFs) . 

35 - la Figure 4 represente une analyse phylogenique 

identifiant la f ami lie HERV-W. 
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- la figure 5 represents 1 'alignement des regions 
flanquantes 5' et 3 • du clone RG083M05 avec les regions 5» 
et/ou 3 • terminales de certains clones placentaires ; le 
tandem CAAC flanquant les LTR 3' et 5» est souligne 
5 doublement sous les sequences d'ADN, la sequence LTR 
consensus de 783 pb (paires de bases) est indique au bas 
de I'alignement ; le PPT en amont de l»extreinite 5' de LTR 
et le PBS en aval de 1 • extremite 3» de LTR sont indiques ; 
les regions U3R et U5 sont indiquees ; les sites 

10 correspondant a la fixation du facteur de transcription 
sont soulignes et numerotes de 1 a 6 ; la region -7 3 a 284 
correspond ^ la sequence evaluee en "CAT assay" * 
correspond S des sites putatifs de "capping" ; [polyA] 
indique le signal de polyadenylation. 

^5 - la Figure 6 represente une sequence putative 

d»un polypeptide d'enveloppe (ORFl) de HERV-W obtenu a 
partir de 3 clones d'ADNc placentaires diff brents ; le 
peptide leader (L) , la proteine de surface (SU) et la 
proteine transmembranaire (TM) sont indiquees par des 

20 fleches ; le peptide de fusion hydrophobe et la region 
carboxy transmembranaire sont soulignes par un trait 
simple et un trait double, respectivement ; la region 
d« immunosuppression est signalee en italiques ; les sites 
potentiels de glycosylation sont indiques par des points ; 

25 les acides amines divergents sont indiques sur la ligne 
infferieure ; la figure 6 pr^sente egalement les trames de 
lecture ouverte correspondant a ORF2 et ORF3 tels que 
decrits a la Figure 2, et plus particulierement leurs 
homologies avec les gSnes de regulation rfetroviraux. 

30 

Le materiel nucleique prec^demment explicite a et§ 
decouvert et caracterise au terme du protocole 
experimental decrit ci-apres, etant entendu que ce 
protocole ne saurait limiter la portee de la presente 
35 invention et des revendications en annexe. 
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Exemple l 

Isolement et sequen^age de fragments d'ADMc 
chevauchants 

5 Les informations concernant 1 • organisation de 

HERV-W ont 6t^ obtenues en testant une bangue d'ADNc 
placentaire (Clontech cat#HL5014a) avec les sondes 
Ppol-MSRV (SEQ ID NO: 29) et Penv-C15 (SEQ ID NO: 31) (cf 
, Exemple 8) , et en pratiquant ensuite une technique de 

10 "gene walking" a I'aide des nouvelles sequences obtenues. 
Les experiences ont ete mises en oeuvre en se referant aux 
preconisations du fournisseur de la banque. Des 
amplifications PCR sur ADN ont egalement ete exploitees 
pour comprendre cette organisation. 

15 Un certain nombre de clones ont 4t4 s^lectionnSs 

et s^quenc^s, cf Figure 1: 

- Clone C1.6A2 (SEQ ID NO: 1) : region 5* noh 
traduite de HERV-W et une partie de gag 

- Clone C1.6A1 (SEQ ID NO: 2): gag et une partie 

20 de pol 

- Clone C1.7A16 (SEQ ID NO: 3): Region 3' de pol 

- Clone cl.Pi22 (SEQ ID NO: 4): region 3' de pol 
et debut de env 

- Clone cl.24,4 (SEQ ID NO: 5) : ARN episse 
25 comprenant une partie de la region 5' non traduite de 

HERV-W, la fin de pol et la region 5* de env 

- Clone C1.C4C5. (SEQ ID NO: 6) : fin de env et 
region 3 • non traduite de HERV-W 

- Clone C1.PH74 (SEQ ID NO: 7) : ARN sous- 
30 g^nomique : region 5» non traduite de HERV-W, fin de pol, 

env, et region 3 • non traduite de HERV-W 

- Clone C1.PH7 (SEQ ID NO: 8) : ARN multi-episs6 : 
region 5» non traduite de HERV-W, fin de env et region 3» 
non traduite de HERV-W. 

35 - Clone cl.PiST (SEQ ID NO: 9) : gene pol partial 

et region U3-R 
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- Clone cl.44.4 (SEQ ID NO: 10) : region R-U5, 
gdne gag et gdne pol partiel. 

A I'aide de ces clones, en proc^dant a des 
alignements de sequences, un modele de sequence totale de 
5 HERV-W a ete elabore, Les ARN episs^s ont ete mis en 
evidence ainsi que les sites potentiels donneurs et 
accepteurs d'epissage. L' ensemble de ces informations est 
montre a la Figure 2. Par etude de similitude avec des 
retrovirus existants, les entites LTR, gag, pol et env ont 
10 ete definies. 

L' organisation genetique putative de HERV-W sous 
forme ARN est la suivante (SEQ ID NO: 11) : 
g^ne i. .7582 

Localisation des clones sur la sequence ARN genomique 
15 reconstruite 

C1.6A2 (1321 pb) 1-1325 ; 

C1.PH74 (535+2229= 2764 pb) 72-606 et 5353- 
7582; 

cl.24.4 (491+1457== 1948 pb) ; 115-606 et 5353- 
20 6810; 

cl.44.4 (2372 pb) 115-2496 ; 

C1.PH7 (369+297= 666pb) 237-606 et 7017-7313; 
C1.6A1 (2938 pb) 586-3559.; 

cl.PiST (2785+566= 3351 pb) 2747-5557 et 7017- 
25 7582; 

C1.7A16 (1422 pb) 2908-4337; 

cl.Pi22 (317+1689 = 2006 pb) 3957-4273 et 

4476-6168; 

C1.C4C5 (1116 pb) 6467-7582 
30 5'LTR 1..120 

/note="R of 5 'LTR (extr^mitS 5» 

incertaine" 

121. .575 

/note="U5 of 5* LTR" 
35 divers 579.. 596 

/note="PBS primer binding site pour tRNA-W" 
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divers 



divers 

10 divers 
ORF 

15 divers 
ORF 
ORF 

20 

divers 
3'LTR 
25 divers 



606 

/note^" jonction d*4pissage (site donneur 
d'epissage ATCCAAAGTG-GTGAGTAATA et sit:e 
acceptzeur d*6pissage cttttttcag-atgggaaacg 
clone RG083M05, GenBank accession 
AC000064) " 
5353 

/note="site accepteur d'epissage pour 
l»ORFl (env)" 

5560 

/note="site donneur d'epissage" 
5581. .7194 

/note="ORFl env 53 8 AA" 

/produit-="envel6ppe" 

7017 

/noteB**site accepteur d*Splssage pour ORF2 et ORF3" 

7039. .7194 

/note="ORF2 52 AA" 

7112. .7255 

/note="ORF3 48 AA" 

7244.. 7254 

/not:e="PPT polypurine tract" 
7256. .7582 

/note-="U3-R of 3' LTR (jonction U3-R indeterminSe ) 
7563.. 7569 

signal de polyadenylation 



30 Exemple 2 : 

Identification de clones g&nomigues (ADN) 
correspondant aux clones d*ADH isoles 

Une interrogation "blastn" sur plusieurs bases de 
35 donn^es, cl I'aide du genome reconstruit, roontre c[u"il 
existe une quant ite importante de sequences apparentees 
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dans le genome huxnain. Environ 400 sequences ont 6t:6 
identifiees dans GenBank et plus de 200 sequences dans la 
banque EST, la plupart en anti-sens. Les 4 sequences les 
plus signif icatives en taille et en similitude, illustr^es 
5 sur la figure 3, sont les clones genomiques (ADN) 
suivants : 

le clone humain RG083M05 (gb AC000064) dont la 
localisation chromosomique est 7q21-7q22, 

le clone humain BAC378 (gb U85196, gb AE000660) 
10 correspondant au locus alpha delta du recepteur des 
cellules T, localise en 14qll-12, 

le cosmide humain Q11M15 (gb AF045450) 
correspondant a la region 2lq22.3 du chromosome 21, 

le cosmide U134E6 (embl Z83850) sur le chromosome 

15 Xq22. 

La localisation des regions alignees pour chacun 
des clones est indiquee et 1 ■ appartenance a un chromosome 
est indiquee entre crochets. Le pourcentage de similitude 
(sans les larges deletions) entre les 4 sequences et I'ARN 

20 genomique reconstruit est indique, ainsi que la presence 
de sequences repetees a chaque extremite du genome et la 
taille des plus grandes trames de lecture (ORE) . Des 
sequences repetees sont trouvees aux extremites de 3 de 
ces clones. La sequence reconstruite est contenue 

25 integralement ^ I'intferieur du clone RG083M05 (9,6 Kb) et 
presente une similitude de 96%. Cependant le clone 
RG083M05 presente une insertion de 2 Kb situ€e 
imm^diatement en aval ^ de la region 5* non traduite (5« 
UTR) , Cette insertion est 6galement trouv^e dans deux 

3 0 autres clones genomiques qui prfesentent une deletion de 
2,3 Kb immSdiatement en amont de la region 3 ' non traduite 
(3» UTR). Aucun clone ne contient les trois trames de 
lecture (ORFs) gag, pol et env f onctionnelles . Le clone 
RG083M05 montre une ORF de 538 acides amines (AA) 

35 correspondant a une enveloppe entiere. Le cosmide Q11M15 
contient deux grandes ORFs contigiies de 413 AA (trame O) 
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et 305 AA (trame +1) correspondant a une polyproteine pol 
^ronquSe. 

Exemple 3 
5 Analyse phylogenique 

Une analyse phylogenique a ete realisee au niveau 
des acides nucleiques sur 11 sous-regions differentes de 
. I'ARN genomique reconstruit, et au niveau proteique sur 2 

10 sous-regions differentes de env, Tous les arbres obtenus 
presentent la meme topologie quelle que soit la region 
etudiee. Ceci est. illustre a la Figure 4 au niveau des 
acides nucleiques dans les regions LTR et pol les plus 
conserv^es entre les sequences obtenues et ERV-9 et RTLV- 

15 H. Les arbres montrent clairement que les sequences 
experimentales decrivent une nouvelle f amille distincte de 
ERV-9 et tres distincte de RTLV-H comme souligne par 
1* analyse en "bootstrap". Ces sequences sent trouv^es-, sur 
plusieurs chromosomes, notamment les chromosomes 3, 7, 14, < 

20 16, 21, 22, et X avec une forte concentration apparente de 
LTR sur le chromosome X. 

La comparaison au niveau proteique entre les 
regions les plus conservees des proteines retrovirales env 
montre que la famille HERV-W est plus proche des 

25 retrovirus simiens de type D et des retrovirus de la, 
reticuloendoth^liose aviaire que les retrovirus mammifdres 
de type C. 

Ceci suggere une structure genomique chim^re C/D. 

30 

Exemple 4 

Identification des Elements LTR, PPT et PBS 

La sequence reconstruite (ARN) est contenue 
35 integralement a 1 » interieur du clone genomique RG083M05 
(9,6 Kb) et presente une similitude de 96 % avec deux 
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regions discon-kinues de ce clone qui contient egalement 
des regions r^petees a chaque extr^mite. L*alignement des 
sequences exp^rimentales correspondant aux regions 5 ' et 
3* de 1*ARN genomique reconstruit avec I'ADN du clone 
5 RG083M05 [ 5 • ( 5~RG-28000-28872) et 3 • ( 3-RG-37500-383 14 ) ] a 
permis de deduire une sequence LTR et d» identifier des 
elements caracteristiques des retrovirus, notamment ceux 
impliques dans la transcription inverse, a savoir PBS en 
aval du LTR 5* et le PPT en amont du LTR 3' (cf Figure 5). 

10 On remarque que 1* element U3 est extremement court en 
comparaison de celui observe chez les retrovirus de type C 
des mammif eres, et est comparable en taille a la region U3 
gSneralement decrite chez les retrovirus de type D et les 
retrovirus a via ire. La region correspondant aux bases 23 64 

15 a 2720 du clone cl.PH74 (SEQ ID NO: 7) a et6 amplifi^e par 
PGR et sous-clonee dans le vecteur pCAT3 (Promega) afin de 
r^aliser 1* evaluation de I'activite promotrice. Une 
activity significative a 6te trouv^e dans des cellules 
HeLa par la methode dite du "CAT assay" montrant la 

20 f onctionnalite de la sequence promotrice du LTR. 

La region PBS est homologue au PBS des retrovirus 

aviaires. 



25 Exemple 5 

Organisation genetigue et regulation de 
1' expression 

Organisation sous forme ADN 

30 Des amplifications PGR ont 6t§ rfealisees sur des 

clones HERV-W entiers recuperes sur banque genomique 
humaine (voir exemple l pour le mode d'obtention) , en 
utilisant les couples d 'oligonucleotides suivants : 
U5 4992 (SEQ ID NO: 16), GAG 4619 (SEQ ID NO: 17) 

35 GAG 4782 (SEQ ID NO: 18), POL 3167 (SEQ ID NO: 19) 
POL 3390 (SEQ ID NO: 20), POL 5144 (SEQ ID NO: 21) 
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POL 5145 (SEQ ID NO: 22), U5 4991 (SEQ ID NO: 23). 

Les PGR sont realisees dans les conditions 
suivantes : 

Oligonucleotides a la concentration de 0,3 3 
5 microMolaire 

Tampon TAQ polymerase Boerhinger IX 
0,5 unite de TAQ polymerase Boerhinger 
Melange de dNTP a 0,25 mM chacun 
0,5 mg d*ADN humain 
10 Volume final 100 ml . . 

- . Conditions de PGR (95°C, 5 min) x 1, (95*G, 30 sec 

+ 54°C, 3 0 sec + 72*'G 3 min) x 35. 

Les produits de PGR ont ensuite et§ d^pos^s sur 
gel d' agarose 1% pour Stre analyses apres migration. 
15 L' ensemble des PGR donne des fragments d * amplification de 
taille attendue, excepte pour la PGR LTR-4991 — gag-4619 
qui donne un fragment de taille sup^rieure d' environ 2 Kb£ 
.par rapport a la taille attendue (d^duite a partir des't 
cDNA de la bangue placenta ire) . La reconstitution de ' 
20 HERV-W sous forme ADN endogene represente done une entity 
d' environ 10 Kb. 

Apres clonage, sequengage et analyse de la PGR- 
4 992 gag-4619, on constate la presence d'une region 
d* insertion entre LTR et gag de SEQ ID NO: 12 (clone 
25 C1.6A5). Gette region ne correspond pas a une region 
traditionnelle non traduite d'un retrovirus : pas de 
region Y ni de PBS. 

Les produits de PGR pol-3390, pol-5144 ont ete 
ega lament clones et deux des clones obtenus ont ete 
30 sequences. Le resultat de ces sequences est donne par les 
clones C1.7A20 (SEQ ID NO: 13) et cl.7A21 (SEQ ID NO: 14). 
La comparaison de ces deux sequences nucleotidiques donne 
un score de 90% d'homologie pour la region concernee, 
montrant ainsi la variabilite de HERV-W chez un meme 
3 5 individu . 

HERV-W sous forme ADN est propose la Figure 2- 
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Organisation g^nerale : processus de transcription 

Les differents clones ADNc etant obtenus, des 
rfesultats acquis en PGR sur ADN, on deduit : 
.5 - une organisation ADN de 10 Kb possedant une 

sequence d* insertion de 2 Kb entre LTR et gag. 

Le resultat de PGR sur ADN montrant la presence 
d'un insert de 2 Kb entre les regions LTR et gag suggere 
que les ADNc isoles dans le placenta proviennent de 
10 1* expression d'un genome de type RG083M05. 

" une organisation ARN de 8 Kb resultant d ' une 
transcription de 10 Kb suivie d'un epissage entre LTR et 
gag permettant de restaurer une continuite RF (Region 
Flanquante) 5« gag, et donnant ainsi un ARN de 8 Kb tel 
15 que mis en Evidence en Northern Blot. 

Les sondes gag (Pgag-LB19, SEQ ID NO: 30) et 
protease (Ppro-E, SEQ ID NO: 32) r^v^lent un ARN de taille 
voisine a 8 Kb, la sonde Penv-C15 (SEQ ID NO: 31) rdvele 
en plus un ARN voisin de 3,1 Kb. Deux sondes definies dans 
20 la region 5» non traduite, obtenues par le criblage de la 
banque cDNA relate ci-dessus (sonde P5 ' -gag-cl . 6A2 derivee 
du clone cl.6A2 et sonde P5 ' -env-cl . 24 . 4 derivee du clone 
cl.24.4) revelent les deux precedents ARN et un ARN 
d* environ 1,3 Kb. Cette distribution des ARNs est typique 
25 de transcrits de retrovirus complexes : un ARN genomique 
codant pour gag-pro-pol, un ARN sous -genomique codant pour 
I'enveloppe, et un/des ARN multi-episs^ (s) codant 
potent iellement pour des genes de regulation. 

La demie vie d'un tel ARN ( LTR-R-U5- Insert ion-GAG- 
30 POL-ENV-U3-R-HERV-W) est vraisemblablement tres courte, 
car aucun ARN de 10 Kb n'est detects en Northern Blot. Par 
analyse et comparaison de sequences, les sites potentials 
donneurs (DSl et DS2) et accepteurs (ASl a AS3) d* epissage 
ont ete def inis et decrits dans la Figure 2 • 

35 
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Exemple 6 

Transcription dans des tissus sains 

Diff^renlis tiissus humains sains ont: ^t:e t:es1:es par 
5 une - technique de Northern Blot (Human Multiple Tissue 
Northern Blot, Clontech cat# 7760-1), a l*aide des sondes 
Ppol-MSRV (SEQ ID' NO: 29), Pgag-LB19 (SEQ ID NO: 30), 
Penv-C15 (SEQ ID NO: 31), Ppro-E (SEQ ID NO: 32), P5 • -gag- 
C1.6A2 et P5 ' -env-cl . 24 . 4 , marquees comme deer it dans 
10 1* exemple 1- Les experiences ont ete realisees en suivant 
les recommandations des fabricants, et les 

autoradiographies ont ete exposees 5 jours. L' analyse des 
. resultats revele des produits de transcription uniquement 
dans le placenta, et dans aucun des autres tissus huinains 
15 testes (coeur, cerveau, poumon, foie, muscle sguelettique, 
rein et pancreas) . 

Par une technique de Dot Blot ARN (Clontech 
-Human RNA Master Blot Cat# 7770-1),- et en utilisant le" 
protocole experimental preconise par le fabr leant, une- 
20 quarantaine d* autres tissus, dont des tissus foetaux, ont 
6te testes : seul le placenta donne une reponse specif ique 
apres hybridation avec les sondes Pgag-LB19 
(SEQ ID NO: 30) et Penv-C15 (SEQ ID NO: 31). 

On constate qu'un signal est observe dans le rein 
25 en Dot-Blot ARN, ce qui est infirme par 1« analyse en 
Northern Blot. ... 



Exemple 7 

3 0 Identification d*un ARKm codant pour une enveloppe 

et les moyens de le ditecter specif iquement 

Le criblage d*une banque d'ADNc placentaire a 
I'aide d'une sonde definie dans la region 5* non traduite 
. 35 a permis d'isoler un ADNc defini par une region 5* non 
traduite (5* NTR) , une jonction d*6pissage, une sequence 
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codante, une region 3» non traduite (3' NTR) et une queue 
polyad^nylee, cl.PH74 (SEQ ID NO: 7), Ce clone correspond 
^ un ARN ^piss6 codant pour une enveloppe. Par comparaison 
de sequences entre ce cDNA et le modele de HERV-W endogene 
5 propose selon Figure 2, on identifie une jonction 
d'epissage sur I'ARNm, jonction d*epissage . mettant en 
continuite la region 5» NTR et le gene env, conduisant S 
1 'elaboration d'un ARN sous genomique episse codant pour 
le gene d» enveloppe. Ces informations ont permis de 

10 definir un oligonucleotide specifique de cet ARNiti, en 
choisissant une localisation situee sur le site d»epissage 
(Oligo 5307, selon SEQ ID NO: 24). 

La mise en evidence de cette region de jonction 
permet d'etablir un. precede de discrimination entre ARN et 

15 ADN retroviral endogene, en utilisant dans une PGR un 
oligonucleotide defini sur cette region de jonction, 
notamment un oligonucleotide choisi dans le g^ne env 
(Oligo 4986, selon SEQ ID NO: 25). 

Les PGR sont realisees dans les conditions 

20 suivantes : 

Oligonucleotides a la concentration de 
0,3 3 microMolaire 

Tampon TAQ polymerase Boerhinger IX 
0,5 unite de TAQ polymerase Boerhinger 
25 Melange de dNTP a 0,25 mM chacun 

0,5 mg d*ADN humain 
Volume final 100 ml 
Sur 10 ADN diff^rents testes, ce type de PGR n»a 
pas permis d'obtenir de produits d* amplification. Par 
30 centre sur ADNc issu d'ARN placentaire ou de cellules 
exprimant HERV-W, cette PGR donne un produit 
d' amplification. Ge r^sultat confirme done la nature 
specif iquement ARN de ce fragment sous-'gSnomique. 

35 
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Exemple 8 

Identification de sequences codantes, contenues 
dans un ARNm sp§cif igue 

5 La strat^gie d'epissage decrite dans 1* exemple 5 

est compatible avec la presence de trois trames de lecture 
ORFl (SEQ ID NO: 33), ORF2 (SEQ ID NO: 34) et ORF3 
(SEQ ID NO: 35) (of Figure 6) . 

Le criblage d*une banque d'ADNc placentaire a 

10 permis d'isoler un ADNc (SEQ ID NO: 7, cl.PH74) defini par 
une region 5* non traduite (5' NTR) , une jonction 
d'epissage, une sequence codante, une region 3* non 
traduite (3* NTR) et une queue polyadenylee. La sequence 
codante est de 538 acides amines (SEQ ID NO: 33). Les 

15 analyses effectuees sur banques de donn^es permettent de 
mettre en evidence des caract^ristigues d'une enveloppe 
, rfetrovirale complete. : d6but de traduction d'une 
polyproteine d' enveloppe, d'un peptide leader fortement 
hydrophobe d« environ 21 acides amines, d'une proteine de 

20 surface SU, d*une proteine transmembranaire TM. Ces deux 
entites proteiques presentent differents sites potentiels 
de glycosylation . Au sein de la proteine TM, on identifie 
une region immunosuppressive. 

22 pb et 95 pb ' en amont du site accepteur 

25 d'epissage, on a trouve respectivement deux codons 
d * initiation susceptibles de diriger la synthese de 52 AA 
(ORF2, SEQ ID NO: 34) et de 48 AA (0RF3, SEQ ID NO: 35). 
ORF2 consiste en une partie de 1 • extremite carboxy- 
terminale de env et ORF3 correspond a une traduction 

30 differente mais chevauchante . 

Aucune homologie significative n'a 6t6 retrouvfee 
par interrogation "blast" . Cependant une interrogation 
LFASTA dans une sous-banque de donn^e limit^e aux 
Retrovir idae, ORF2 et ORF3 ont montre un pourcentage 

35 d*idendite de 35 % avec, respectivement. Rex du virus T- 



BNSOOCID: <WO_990ae9eA1_l_> 



wo 99/02696 PCT/FR98/01442 



30 

lymphotrope humain et primate, et avec Tat du virus siroien 
de 1 ' inununodef icience . 



5 Exemple 9 

Complexity de la famille HERV-H 

Le nombre de copies presentes dans le genome 
humain de chacune des sequences est evalue par une 

10 technique de Dot Blot, a I'aide des sondes Pgag-LB19 
(SEQ ID NO: 30), Ppro-E (SEQ ID NO: 32) et Penv-C15 
(SEQ ID NO: 31) . 

Chacune des sondes est denaturee et deposee sur 
une membrane Hybond N+ a raison de 2,5, 5, lo, 25, 50, 

15 100 pg par dSpdt. 0,5 mg d*ADN humain sent egalement 
dSposSs sur la meme membrane. Les membranes sent s&chSes 
2 heures sous vide a SO^'C. Les membranes sent ensuite 
hybridees avec la sonde d§pos6e. Les techniques de 
marquage des sondes, d •hybridation et de lavage des 

20 membranes sont les memes que pour le Southern Blot. Apres 
autoradiographic des membranes, on constate des niveaux 
d^intensite de signal proportionnels aux depots sur 
membrane. Apres decoupage des zones d 'hybridation, un 
comptage en scintillation est realise. Par comparaison 

25 entre la gamme de dilution de la sonde deposee sur 
membrane et le resultat obtenu avec 1*ADN humain, on peut 
evaluer le nombre de copie par genome haplolde de chacune 
des regions couvertes par les sondes : 

- le nombre de gag endogene est Svalu^ de 56 ^ 112 
30 copies (76) 

- le nombre de protease endogene est ^valu§ de 166 
a 334 copies (260) 

- le nombre de env endogene est ^valug infdrieur S 
52 copies (13) . 

35 Le criblage de 10^ clones d'une bangue d'ADN 

placentaire humain (Clontech cat# H15014b) a permis de 
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denombrer 144 clones reconnus par la sonde Pgag-LB19, et 
64 clones reconnus par la sonde Penv-C15. 13 clones 
hybridds conjointement par les sondes Penv-C15 et 
Pgag-LB19 ont 6te Isolds, confirmant la presence de 
5 plusieurs copies d'un genome possSdant a la fois gag et 
env, sans consideration de f onctionnalite. 

Le materiel nucleique, les sequences 

10 nucleotidiques, et les peptides ou proteines 
eventual lement exprimees par lesdits mater iels et 
sequences, peuvent etre utilises pour detecter, prevoir, 
* traiter et suivre toute maladie auto-immune, et les 
pathologies qui lui sont associees, ainsi que des cas-'de 
15 grossesse pathologique ou d'insucces de grossesse. 

En effet, les donn^es objectives et experiment ales 
permettent de relier retrovirus et maladies auto-immunes 
et retrovirus et perturbations de la grossesse : ;i 

(1) des mecanismes communs sont mis en oeuvre dans 
20 les pathologies retrovirales et dans des maladies auto- 
immunes (presence d* auto-anticorps, de complexes immuns, 
infiltration cellulaire de certains tissus, troubles 
neurologiques) . 

(2) des desordres pathologiques comparables a 
25 certaines maladies auto-immunes apparaissent lors des 

infections par les retrovirus HIV et HTLV (syndrome de 
Sjogren, lupus erythemateux dissemine, arthrite 
rhumatoide. . . ) • 

(3) une activite transcriptase inverse a ete 
30 detectee et des particules de type retroviral ont ete 

observees dans les surnageants de cultures cellulaires de 
patients atteints de sclerose en plaques (Perron et coll. 
Res. Virol, 1989; 140: 551-561 / Lancet 1991; 337: 862-863 
/ Res. Virol. 1992; 143: 337-350) ou de polyarthrite 
3 5 rhumatoide • 
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(4) des pathologies animales inf lammatoires 
chronigues ou auto-immunes sont li6es aux retrovirus 
endogdnes; certaines d'entre elles sont utilisees comme 
modeles animaux de maladies humaines (diabSte insulino- 

5 dependant, lupus erythemateux dissemine) . 

(5) des taux signif icatif s d'anticorps anti- 
r^trovirus endogenes ont 6te decrits dans le cadre de 
maladies auto-immunes, systemigues ou inf lammatoires; 
d'autres donnees dans ce sens ont ete communiqu^es par 

10 plusieurs auteurs au IVeme meeting europeen sur les 
retrovirus endogenes (Uppsala, octobre 1996). D»apres 
Venables (communiques du IVeme meeting europeen sur les 
retrovirus endogenes, Uppsala, octobre 1996) , on retrouve 
un taux d»anticorps anti-HERV-H signif icativement eleve 

15 pendant la grossesse mais aussi dans le cadre de divers 
dSsordres auto-immuns tels que le syndrome de Sjogren, le 
lupus Erythemateux dissEminE ou la polyarthrite 
rhumatoxde, sans toutefois qu*une preuve de son 
implication directe puisse etre apportee a ce jour. 

20 Ij' implication des retrovirus dans le phenom^ne 

d'auto-immunite reste compatible avec le caractere 
multif actor iel des maladies auto-immunes, systemiques ou 
inf lammatoires qui confrontent des facteurs genetigues, 
hormonaux, environnementaux et infectieux. 

25 Les particules observees dans les surnageants de 

cultures cellulaires de patients atteints de sclerose en 
plagues (Perron et coll. Res. Virol. 1989; 140: 551-561 / 
Lancet 1991; 337: 862-863 / Res. Virol. 1992; 143: 337- 
350) ou de polyarthrite rhumatolde (donnees non publiees) 

30 peuvent r&sulter de 1 'expression: (i) d'un retrovirus 
endog^ne competent pour la replication, (ii) de plusieurs 
retrovirus endogdnes defect if s cooperant par un phenomdne 
de transcompiementation ou (iii) d'un retrovirus exogene. 

Toutes ces observations permettent d*utiliser et 

35 considerer les materials biologigues precedemment decrits. 
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coiame marqueur d'une maladie auto-immune ou de 
perturbations de la grossesse. 

En particulier, les techniques de marquage 
suivantes sont consider^es : 
5 - balayage du genome humain avec des sondes 

d ' hybridation k forte stringence, d^rivees du materiel 
nucleique prec^demment d^crit, 
. . - amplification directe d*ADN gSnomique par PGR, 

en utilisant des amorces specifiques pour la region 
10 consideree 

~ analyse des regions flanquantes de genes 
cellulaires etrangers. 
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REVENDICATIONS 
1/ Materiel nucleique de type genomique 
retroviral, a l'6tat isole ou purifie, au moins 
partiellement fonctionnel ou non fonctionnel, dont le 
5 genome comprend une sequence nucl^otidique de reference 
choisie dans le groupe incluant les sequences 
SEQ ID NOs: 1 a 15, leurs sequences complementaires, et 
leurs sequences equivalentes , notamment les sequences 
nucleotidiques presentant, pour toute suite de 100 

10 monomeres contigus, au moins 70% et pref erentiellement au 
moins 90% d'homologie avec respectivement lesdites 
sequences SEQ ID NOs: 1 a 15. 

2/ Materiel nucleique de type genomique 
retroviral, a I'etat isol§ ou purifie, au moins 

15 partiellement fonctionnel ou non fonctionnel, dont le 
genome comprend une sequence nucl^otidique de reference, 
codant pour tout polypeptide presentant, pour toute suite 
contigue d'au moins 30 acides amines, au moins 80%, et de 
preference au moins 90% d»homologie avec une sequence 

20 peptidique susceptible d'etre cod^e par au moins une 
partie f onctionnelle de la sequence nucl^otidique de 
reference selon la revendication 1. 

3/ Materiel nucleique de type genomique retroviral 
selon I'une quelconque des revendications 1 et 2, 

25 comprenant un fragment nucleique insere entre deux 
sequences correspondant respectivement ^ la region LTR et 
au gene gag de la structure genomique retrovirale, 
notamment un fragment nucleique const itu€ par ou 
comprenant la sequence SEQ ID NO: 12. 

30 4/ Materiel nucleique de type retroviral sous- 

genomique, constitu^ par une sequence nucleotidique 
identique a SEQ ID NO: 11, avec au moins une deletion, 
telle qu'une sequence choisie parmi SEQ ID NOs: 7^9, 

5/ Materiel nucleique selon I'une quelconque des 

35 revendications 1 et 4, comprenant au moins une sequence 
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nucleotidique f onctionnelle codant pour au moins une 
proteine retrovirale, 

6/ Materiel nucleique selon I'une quelconque des 
revendications 1 et 4 , comprenant au moins une sequence 
5 nucleotidique de regulation. 

7/ Fragment nucleotidique d'au moins 100 bases, 
comprenant une sequence nucleotidique choisie dans le 
groupe comprenant : 

a) toutes les sequences nucleotidiques , partielles 
10 et totales d'un materiel nucleique selon I'une quelconque 

des -revendications l a 6 

b) toutes les sequences nucleotidiques, partielles 
et totales d*un clone choisi dans le groupe incluant les 
clones : 



15 




C1.6A2 


(SEQ 


ID 


NO: 


1) 






C1.6A1 


(SEQ 


ID 


NO: 


2) 






C1.7A16 


(SEQ 


ID 


NO: 


3) 






cl.Pi22 


(SEQ 


ID 


NO: 


4) 






cl.24.4 


(SEQ 


ID 


NO: 


5) 


20 




C1-C4C5 


(SEQ 


ID 


NO: 


6) 






C1.PH74 


(SEQ 


ID 


NO: 


7) 






C1.PH7 


(SEQ 


ID 


NO: 


8) 






cl.PiST 


(SEQ 


ID 


NO: 


9) 






cl.44.4 


(SEQ 


ID 


NO: 


10) 


25 




HERV-W 


(SEQ 


ID 


NO: 


11) 






cl. 6A5 


(SEQ 


ID 


NO: 


12) 






C1.7A20 


(SEQ 


ID 


NO: 


13) 






C1.7A21 


(SEQ 


ID 


NO: 


14) 






liTR 


(SEQ 


ID 


NO: 


15) 



30 c) les sequences respect ivemcnt compl^mentaires 

aux sequences selon a) et b) 

d) les sequences respect ivement ^quivalentes aux 
sequences selon a) a c) , notamment les sequences 
nucleotidiques pr^sentant, pour toute suite de 100 

35 inonomeres contigus, au moins 50%, et de preference au 
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moins 70%, par exemple au moins 90% d'homologie avec les 
sequences a) a c) . 

8/ Sonde nucleique de detection d'un materiel 
nucleique, insere ou non dans un acide nucleique 
5 caracterisee en ce qu'elle est susceptible de s'hybrider 
specif iquement sur un materiel nucleique, selon l*une 
quelconque des revendications 1 a 6, ou un fragment 
nucleique selon la revendication 7 . 

9/ Sonde selon la revendication 8, caracterisee en 
10 ce qu'elle comprend un marqueur. 

10/ Amorce nucleique pour 1 ' amplification par 
polymerisation d'un ARN ou d»un ADN, caracterisee en ce 
qu'elle comprend une sequence nucleotidique susceptible de 
s*hybrider specif iquement sur un materiel nucleique selon 
15 l»une quelconque des revendications 1 a 6 , ou un fragment 
nucleique selon la revendication 7 . 

11/ Sonde nucleique ou amorce nucleique 
caracterisee en ce qu'elle est constitute par une sequence 
nucleotidique choisie dans le groupe incluant 
20 SEQ ID NOs: 16 a 28. 

12/ ARN ou ADN, et notamment vecteur de 
replication, comprenant un fragment nucleotidique selon la 
revendication 7 . 

13/ Peptide code par tout cadre de lecture ouvert 
25 appartenant a un fragment nucleotidique selon la 
revendication 7, notamment polypeptide, par exemple 
oligopeptide formant un determinant antigenique reconnu 
par des sera de patients affectes par une maladie auto- 
immune, ou une pathologie qui lui est associee, ou par des 
30 patientes ayant une grossesse pathologique ou un insucc^s 
de grossesse. 

14/ Peptide selon la revendication 13, caracterise 
en ce qu'il est code par un fragment nucleotidique 
comprenant un cadre de lecture ouvert codant pour une ou 
35 des proteines ENV retrovirales. 
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15/ Utilisation d'un materiel nucleique selon les 
revendications 1 a 6, ou d»un fragment nucleotidique selon 
la revendication 7, ou d'un peptide selon la revendication 
13 ou 14, comme marqueur moleculaire d'une maladie auto- 
5 immune ou d'une pathologie qui lui est associee, ou d'une 
grossesse pathologique ou d'un insucces de grossesse. 

16/ Utilisation d»un materiel nucleique selon les 
revendications 1 a 6, ou d*un fragment nucleotidique selon 
la revendication 7, comme marqueur chromosomique d'une 

10 susceptibilite a une maladie auto-immune ou d'une 
pathologie qui lui est associee, ou d'un risque d'une 
grossesse pathologique ou d'un insucces de grossesse. 

17/ Utilisation d'un materiel nucleique selon les 
revendications 1 a 6, ou d'un fragment nucleotidique selon 

15 la revendication 7, comme marqueur de proximite d'un genei' 
de susceptibilite a une maladie auto-immune ou a une - 
pathologie qui lui est associee, ou a un risque d'une - 
grossesse pathologique ou d'un insucces de grossesse. ^ ^• 

18/ Precede de marquage moleculaire d'une maladie 

20 auto-immune ou d'une pathologie qui lui est associee, 
d'une grossesse pathologique ou d'un insucces de 
grossesse, caract^ris^ en ce qu'on identifie et/ou 
quantifie dans tout materiel biologique corporel, 
notamment fluide corporel, tout fragment nucleotidique 

25 selon la revendication 7, soit sous forme d'ARN, soit sous 
forme d'ADN. 

19/ Procede selon la revendication 18, caract^ris^ 
en ce qu'on detecte dans ledit materiel biologique 
corporel, des cellules exprimant le fragment nucleotidique 
30 selon la revendication. 

20/ Composition diagnostique ou therapeutique 
comprenant un materiel nucleique selon les revendications 
1 a 6, ou un fragment nucleotidique selon la revendication 
7, ou un peptide selon la revendication 13 ou 14. 

35 
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R 

QNPTNCWICLPLNFRPYVSI PVPEQWNNFSTEINTTSVLVGPLVSNVEITHTSNLTCVKF 240 

L 

SNTTYTTNSQCIRWVTPPTQIVCLPSGIFFVCGTSAYRCLNGSSESMCFLSFLVPPMAIY 300 
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>< TM 

TEQDLYSYVISKPRNKRVPILPFVIGAGVLGAl^TaTnnTTTfiTnPVVKT.c;nTrT.Mi^r>Miro 350 
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R R Q N 
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ORF2 (52AA) 
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A3.j.Qne?nfint ORF2 et Rex PLr.v-r. 
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+T AP R+ ++ +L AP+Q +++ G+ Q 
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LXSTAGE DE SEQUENCES 



(1) INFORMATIONS GENERALES : 



5 (i) DEPOSANT: 

(A) NOM: BIO MERIEUX 

(B) RUE: CHEMIN DE L • ORME 

(C) VILLE: MARCY L'ETOILE 
(E) PAYS: FRANCE 

10 (F) CODE POSTAL: 69280 



(ii) TITRE DE L' INVENTION: MATERIEL NUCLEIQUE DE TYPE GENOMIQUE 
RETROVIRAL ENDOGENE, ASSOCIE A UNE MALADIE AUTO-IMMUNE ET/OU A DES 
PERTURBATIONS DE LA GROSSESSE ; UTILISATION EN TANT QUE MARQUEUR 
15 t 
(iii) NOMBRE DE SEQUENCES: 35 



(iv) FORME DECHIFFRABLE PAR ORDINATEUR: 
(A) TYPE DE SUPPORT: Floppy disk 
2 0 <B) ORDINATEUR: IBM PC compatible 

(C> SYSTEMS D- EXPLOITATION: PC-DOS/MS-DOS 

(D) LOGICIEL: PatentIn Release #1.0, Version #1.30 (OEB) 



25 (2) INFORMATIONS POUR LA SEQ ID NO: 1: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1321 paires de bases 

(B) TYPE: nucleotide 

3 0 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: ARNm (en ADN) 
35 (iii) HYPOTHETIQUE : NON 
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(xi) DESCRIPTION DE LA SEQUENCE; SEQ ID NO: 1: 

CAACAATCGG GATATAAACC CAGGCATTCG AGCTGGCAAC AGCAGCCCCC CTTTGGGTCC 60 

5 

CTTCCCTTTG TATGGGAGCT GTTTTCATGC TATTTCACTC TATTAAATCT TGCAACTGCA 120 

CTCTTCTGGT CCATGTTTCT TACGGCTCGA GCTGAGCTTT TGCTCACCGT CCACCACTGC 180 

10 TGTTTGCCAC CACCGCAGAC CTGCCGCTGA CTCCCATCCC TCTGGATCCT GCAGGGTGTC 240 

CGCTGTGCTC CTGATCCAGC GAAGCGCCCA TTGCCGCTCC CAATTGGGCT AAAGGCTTGC 300 

CATTGTTCCT GCACGGCTAA GTGCCTGGGT TTGTTCTAAT TGAGCTGAAC ACTAGTCACT 360 

15 

GGGTTCCATG GTTCTCTTCT GTGACCCACG GCTTCTAATA GAACTATAAC ACTTACCACA 420 

TG6CCCAAGA TTCCATTCCT TGGAATCCGT GAGGCCAAGA ACTCCAGGTC AGAGAATACG 480 

20 AAGCTTGCCA CCATCTTGGA AGCGGCCTGC TACCATCTTG GAAGTGGTTC ACCACCATCT 540 

TGGGAGCTCT GTGAGCAAGG ACCCCCCGGT AACATTTTGG CAACCACGAA CGGACATCCA 600 

AAGTGATGGG AAACGTTCCC CGCAAGACAA AAACGCCCCT AAGACGTATT CTGGAAAATT 660 



25 



35 



GGGAACAATT TGACCCTCAG ACACTAAGAA AGAAACGACT TATATTCTTC TGCAGTGCCG 720 



CCTGGCACTC CTGAGGGAAG TATAAATTAT AACACCATCT TACAGCTAGA CCTCTTTTGT 780 

3 0 AGAAAAGGCA AATGGAGTGA AGTGCCATAA GTACAAACTT TCTTTTCATT AAGAGACAAC 840 

TCACAATTAT GTAAAAAGT6 TGATTTATGC CCTACAGGAA GCCTTCAGAG TCTACCTCCC 900 

TATCCCAGCA TCCCCGACTC CTTCCCCACT TAATAAGGAC CCCCCTTCAA CCCAAATGGT 960 



CCAAAAGGAG ATAGACAAAA GGGTAAACAG TGAACCAAAG AGTGCCAATA TTCCCCAATT 1020 
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ATGACCCCTC CAAGCAGTGG GAGGAAGAGA ATTCGGCCCA GCCAGAGTGC ATGTGCCTTT 1080 

TTCTCTCCCA GACTTAAAGC TU^ATAAAAAC AGACTTAGGT AAATTCTCAG ATAACCCTGA 1140 

5 

TGGCTATATT GGTGTTTTAC AAGGGTTAGG ACAATTCTTT GATCTGACAT GGAGAGATAT 1200 

ATATGTCACT GCTAAATCAG ACACTAACCC CAAATGAGAG AAGTGCCACC ATT^CTGCAG 1260 

10 CCTGAGAGTT TGGCGATCTC TGGTATCTCA GTCAGGTCAA TGATAGGATG ACAACAGAGG 1320 
A 1321 

15 (2) INFORMATIONS POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2938 paires de bases 

(B) TYPE: nucleotide 

20 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ARNm (en ADN) 

25 (iii) HYPOTHETIQUE: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 

CAACGACGGA CATCCAAAGT GATGGGAAAC GTTCCCCGCA AGACAAAAAC GCCCCTAAGA 60 

30 

CGTATTCTGG AGAATTGGGA CCAATTTGAC CCTCAGACAC TAAGAAAGAA ACGACTTATA 120 
TTCTTCTGCA GTGCCGCCTG GCACTCCTGA GGGAAGTATA AATTATAACA CCATCTTACA 180 
35 GCTAGACTTC TTTTGTAGAA AAGGCAAATG GAGTGAAGTG CCATAAGTAC AAACTTTCTT 240 
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TTCATTAAGA GACAACTCAC AATTATGTAA 
TCAGAGTCTA CCTCCCTATC CCAGCATCCC 
5 CTTCAACCCA AATGGTCCAA AAGGAGATAG 
CCAATATTCC CCTVATTATGA CCCCTCCCAA 
GAGTGCATGT GCTTTTTCTT CTCCCAGACT 

10 

TCTCAGATAA TCCTGATGGC TATATTGATG 
TGACATGGAG AGATATAATG TCACTGCTAA 
15 CCACCATAAC TGCAGCCTGA GAGTTTGGCG 
GGATGACAAC AGAGGAAAGA GATGATCCCC 
CTCATTGGGG ACACAGTVAAT CAGTAACATG 

20 

TGTGTGCTAC AAGGACTAAG GAAAACTACG 
CACCATAACA CAGGGGAAGG GAAGAAAATC 
25 CATTGAGGAA GCGTGCCTCT CTGTCACCTG 
GTAAGTTTAT CACTCAGTCA GCTGCAGACA 
CCCGGA6CAA AACTTAGAAA CCCTATTGAA 

30 

TCAGGAGGAG CAGGCGGAAC AGGACAAACG 
TGACCCTCAG GCT^GTGGAC TTTGGAGGCT 
35 TGCCTAATAG GGCTTGCTTC CAGTGCGGTC 
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4 

AAAGTGTGAT TTATGCCCTA CAGGAAGCCT 300 
CGACTCCTTC CCCAACTAAT AAGGACCCCC 360 
ACAAAAGGGT AAACAGTGAA CCAAAGAGTG 420 
GCAGTGGGAG GAAGAGATTC GGCCCAGCCA 480 
TAAAGCAAAT AAAAACAGAC TTAGGTAAAT 540 
TTTTACAAGG GTTAGGACAA TTCTTTGATC 600 
ATCAGACACT AACCCCAAAT GAGAGAAGTG 660 
ATCTCTGGTA TCTCAGTCAG GTCAATGATA 720 
ACAGCCAGCA AGCAGTTCCC AGTCTASACC 780 
GGAGATTGGT GCTGCAGACA TTTGCTAACT 840 
AAGAAAATCT ACGAATTACT CAATGATGTC 900 
CTACTGCCTT TCTGGAGA6A CTAAGGGAGG 960 
ACTCTTCTGA AGGCCAACTA ATCTTAAAGC 1020 
TTAGAAAAAA CTTCAAAAGT CTGCCGTAGG 1080 
CTTGGCAACY TCGGTTTTTT ATAATAGAGA 1140 
GGATTAAAAA AAAGGCCACC GCTTTAGTCA 1200 
CTGGAAAAGG G7UVAAGCTGG GCAAATTGAA 1260 
TACAAGGACA CTTTAAAAAA GATTGTCCAA 1320 
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GTAGAAGTAA GCCGCCCCTT CGTCCATGCC CCTTATTTCA AGGGAATCAC TGGAAGGCCC 1380 
ACTGCCCCAG GGGACAAAGG TCTTTTGAGT CAGAAGCCAC TAACCAGATG ATCCAGCAGC 1440 
5 AGGACTGAGG GTGCCTGGGG CAAGCGCCAT CCCATGCCAT CACCCTCACA GAGCCCTGGG 1500 
TATGCTTGAC CATTGAGGGC CAGGAAGGTT GTCTCCTGGA CACTGGTGCG GTCTTCTTAG 1560 
TCTTACTCTT CTGTCCCGGA CAACTGTCCT CCAGATCTGT CACTATCTGA GGGGGTCCTA 1620 

10 

AGACGGGCAG TCACTAGATA CTTCTCCCAG CCACTAAGTT ATGACTGGGG AGCTTTATTC 1680 
TTTTCACATG CTTTTCTAAT TATGCTTGAA AGCCCCACTA CCTTGTTAGG GAGAGACATT 1740 
15 CTAGCAAAAG CAGGGGCCAT TATACACCTG AACATAGGAG AAGGAACACC CGTTTGTTGT ISOOi; 
CCCCTGCTTG AGGAAGGAAT TAATCCTGAA GTCTGGGCAA CAGAAGGACA ATATGGACGA 1860 
GCAAAGAATG CCCGTCCTGT TCAAGTTAT^ CTAAAGGATT CCACTTCCTT TCCCTACCAA 192 0^ 

20 

AGGCAGTACC CCCTCAGACC CAAGGCCCAA CAAGGATTCC AAAAGATTGT TAAGGACTTA 1980 
AAAGCCCAAG GCTTAGTAAA ACCATGCATA ACTCCCTGCA GTAATTCCGT AGTGGATTGA 2040 
25 CGAGGCACAG AAACCCAGTG GACAGTGGAG GGTTAGTGCA AGATCTCAGG ATTATCAATG 2100 
GAGGCCGTTG TCCTTTTATA CCCAGCTGTA CCTAGCCCTT ATACTGTGCT TTCCCAAATA 2160 
CCAGAGGAAG CAGAGTGGTT TACACTCCTG GACCTTTVAGG ATGCCTTCTT CTGCATCCCT 2220 

30 

GTACATCCTG ACTCTCAATT CTTGTTTGCC TTTGAAGATA CTTCAAACCC AACATCTCAA 2280 
CTCACCTGGA CTGTTTTACC CCAAGGGTTC AGGGATAGCC CCCATCTATT TGGCCAGGCA 2340 
35 TTAGCCCAAG ACTTGAGCCA ATCCTCATAC CTGGACACTT GTCCTTCGGT AGGTGGATGA 2400 
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TTTACTTTTG GCCGCCCATT CAGAAACCTT GTGCCATCAA GCCACCCAAG CGCTCTTCAA 2460 
TTTCCTCGCT ACCTGTGGCT ACATGGTTTC CAAACCAAAG GCTCAACTCT GCTCACAGCA 2520 
5 GGTTACTTAG GGCTAAAATT ATCCAAAGGC ACCAGGGCCC TCAGTGAGGA ACACATCCAG 2580 
CCTATACTGG CTTATCCTCA TCCCAAAACC CTAAAGCAAC TAAGGGGATT CCTTGGCGTA 2640 
ATAGGTTTCT GCCGAAAATG GATTCCCAGG TTTGGCGAAA TAGCCAGGTC ATTAAATACA 2700 

10 

CTAATTAAGG AAACTCAGAA AGCCAATACC CATTTAGTAA GATGGACAAC TGAAGTAGAA 2760 
GTGGCTTTCC AGGCCCTAAC CCAAGCCCCA GTGTTAAGTT TGCCAACAGG GCAAGACTTT 2820 
15 TCTTCATATG TCACAGAAAA AACAGGAATA GCTCTAGGAG TCCTTACACA GATCCGAGGG 2880 
ATGAGCTTGC AACCTGTGGC GTACCTGACT AAGGAAATTG ATGTAGTGGC AAAGGGTT 2938 



20 (2) INFORMATIONS POUR LA SEQ ID NO: 3: 

(1) CARACTERISTIQUES OE LA SEQUENCE: 

(A) LONGUEUR: 1422 paires de bases 

(B) TYPE: nucleotide 

25 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

<ii) TYPE DE MOLECULE: ARNnn (en ADN) 

30 (iii) HYPOTHETIQUE: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 

TCAGGGATA6 CCCCCATCTA TTTGGCCAGG CATTAGCCCA AGACTTGAGT CAGTTATCAT 60 

35 

ACCTGGACAC TCTTGTCCTT CAGTATGTGG ATGATTTACT TTTAGCTGCC TGTTCAGAAA 120 
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CCTTGTGCCA TCAAGCCACC CAAGCACTCT TAAATTTCCT CGCCACCTGT GGCTACAAGG 180 

TTTCCAAAGA GAAGCTCAGC TCTGCTCACA GCAGGTTAAA TACTTAGGAC TAAGATTATC 240 
5 . . 

CAAAGGCACC AAGGCCCTCA GTGAGGAATG TATCCAGCCT ATACTGGCTT ATCCTCATCT 300 

CAAAACCCTA AAGCAACTAA GAGAGTTCCT TGGCATAACA GGCTTCTGCC GAATATGGAT 360 

10 TCCCCAGGTA TGGCAAAATA GCCAGGCCAT TATATACAGT AATTAAGGAA ACTCAGAAAG 420 

CCAATACCCA TTTAATAAGA TGGATACCTG AAGCCAAAGT GGCTTTCCAG GCCCCTAAAG 480 

AAGGCCTTAA ACCCAAGTCC CAGTGTTAAG CTTGCCAACG GGGCAAGACT TTTCTTTATA 540 

15 

CATCACAGAA AAAAACAGAA ACAGCTCTGG GAGTCCTTAC ACAGGTCCAA GGGACGAGCT 600 

TGCAACCCAT GGCATACCTG AGTAAGGAAA CTGATGTAGT GGCAAAGGGT TGGCTTCATT 660 

20 GTTTATGGGT AGTGGTGGCA GTAGCAGTTG TAGTATCTGA AGCAGTTAAA ATAATACAGG 720 

GGAGAGATCT TACTGTGTGG ACATCTCATG AGGTGAACAG CATACTCACT GCT/UVAGGAG 780 

ACTTGTGGCT GTCAGACAAC CGTTTACTTA AATATCAGGC TCTATTACTT GAAAGGCCAG 840 

25 

TGCTGCAACT GTGCACTTGT GCAACTCTTA ACCCAGTCNC ATTTCTTCCA GACAATGAAG 900 

ATAGAATATA ACTGTCAACA AATAATTTCT CAAACCTATG CCACTCGAGG GGACCTTCTA 960 

30 GAAGTTCCCT TGACTGATCC TGACCTTCAA CTTGTATACT GATGG/UVGTT CCTTTGTAGA 1020 

AAAA6GACTT CAAAAGCGGG GTATGCAGTG GTCAGTGATA ATGGAATATT TGAAAGTATC 1080 

CCCTCACTCC AGGAACTAGT GCTTAGCTGG CAGAACTAAT AGCCTTCATT GGGGCACTAG 1140 

35 

AATTAGGAGA AGGAAAAAGG GTAAATATAT ATACAGACTC TGAGTATGCT CACCTAGTCN 1200 
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20 



TCCATGCCCA TGAGGCAATA TGCAGAGAAA GGGAATTCCT AACTTCCGAG GGAACACCTA 1260 

TCACACATCA GGAAGCCATT AGGAGATTAT TACTGGCAGT ACAGAAACCT AAAGAGGTGG 1320 

AAGTCTTACA CTGCTGGGGT CATCAGAAAG GAAAGAAAAG GGAAATAGAA GGGAATTGCC 1380 

AAGCAGATAT TGAAGCAAAA AGAGCTGCAA GGCAGGACCC TC 1422 

(2) INFORMATIONS POUR LA SEQ ID NO: 4: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2006 paires de bases 
15 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 



(ii) TYPE DE MOLECULE: ARNm (en ADN) 
(iii) HYPOTHETIQUE : NGN 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 

25 ATGCAGTGGT CAGTGATAAT GGAATACTTG AAAGTAATCC CCTCACTCCA GGAACTAGTG 60 

CTCAGCTAGC AGAACTAATA GCCCTCACTT GGGCACTAGA ATTAGGAGAA GAAAAAAGGG 120 

CAAATATATA TACAGACTCT AAATATGCTT ACCTAGTCCT CCATGCCCAT GCAGCAATAT 180 

30 

GGAAAGAAAG GGAATTCCTA ACTTCTGAGA GAACACCTAT CAAACATCAG GAAGCCATTA 240 

GGAAATTATT ATTGGCTGTA CAGAAACCTA AAGAGGTGGC AGTCTTACAC TGCCGGGGTC 300 

35 ATCANAAAGG AAAGGAAAGG GAAAATACTT TTGCCTGCAA CTATCCAATG GAAATTACTT 360 



FEUILLE DE REWIPLACEMENT (REGLE 26) 



BNSDOCID: <wo flflQgeaaAi I > 



■ • 

wo 99/02696 ' PCT/FR98/01442 

9 

AAAACCCTTC ATCAAACCTT TCACTTAGGC ATCGATAGCA CCCATCAAAT GGCCAAATCA 420 
TTATTTACTG GACCAGGCCT TTTCAAAACT ATCAAGCAAA TATTCAGGGC CTGTGAATTG 480 
5 TGCCAAAAAA ATAATCCCCT GCCTCATCGC CAAGCTCCTT CAGGAAAACA AAAAACAGGC 540 
CATTACCCTG AAAAAAACTG GCAACTGATT TTACCCACAA GCCCAAACCT CAGGGATTTC 600 
AGTATCTACT AGTCTGGGTA AATACTTTCA CGGGTTGGGC AAAGGCCTTC CCCTGTAGGA 660 

10 

CAGAAAAGGC CCAAGAGGTA ATAAAGGCAC TAGTTCATGA AATAATTCCC AGATTCGGAC 720 
TTCCCCGAGG CTTACAGAGT GACAATAGCC CTGCTTTCCA GGCCACAGTA ACCCAGGGAG 780 
15 TATCCCAGGC GTTAGGTATA CGATATCACT TACACTGCGC CTGAAGGCCA CAGTCCTCAG 840 
GGAAGGTCGA GAAAATGAAT GAAATACTCA AAGGACATCT AAAAAAGCAA ACCCAGGAAA 900 
CCCACCTCAC ATGGCCTGCT CTGTTGCCTA TAGCCTTAAA AAGAATCTGC AACTTTCCCC 960 

20 

AAAAAGCAGG ACTTAGCCCA TACG?VAATGC TGTATGGAAG GCCCTTCATA ACCAATGACC 1020 
TTGTGCTTGA CCCAAGACAG CCAACTTAGT TGCAGACATC ACCTCCTTAG CCAAATATCA 1080 
25 ACAAGTTCTT AAAACATTAC AAGGAACCTA TCCCTGAGAA GAGGG/VAAAG AACTATTCCA 1140 
CCCTTGTGAC ATGGTATTAG TCAAGTCCCT TCTCTCTAAT TCCCCATCCC TAGATACATC 1200 
CTGGGAAGGA CCCTACCCAG TCATTTTATT TACCCCAACT GCGGTTAAAG TGGCTGGAGT 1260 

30 

GGTCTTGGAT ACATCACACT TGAGTCAAAT CCTGGATACT GCCAAAGGAA CCTGAAAATC 1320 
CAGGAGACAA CGCTAGCTAT TCCTGTGAAC CTCTAGAGGA TTTGCGCCTG CTCTTCAAAC 1380 
35 AACAACCAGG AGGAAAGTAA CTAAAATCAT AAATCCCCCA TGGCCCTCCC TTATCATATT 1440 

FEUILLE DE REWIPLACENIENT (REGLE 26) 



BNSDCXJID: <WO_8902e96A1J_> 



wo 99/02696 



i 

w 

PCT/FR9a/01442 



10 



10 

TTTCTCTTTA CTGTTCTTTT ACCCTCTTTC ACTCTCACTG CACCCCCTCC ATGCCGCTGT 1500 
ATGACCAGTA GCTCCCCTTA CC7VAGAGTTT CTATGGAGAA TGCAGCGTCC CGGAAATATT 1560 
5 GATGCCCCAT CGTATAGGAG TCTTTCTAAG GGAACCCCCA CCTTCACTGC CCACACCCAT 1620 
ATGCCCCGCA ACTGCTATCA CTCTGCCACT CTTTGCATGC ATGCAAATAC TCATTATTGG 1680 
ACAGGAAAAA TGATTAATCC TAGTTGTCCT GGAGGACTTG GAGTCACTGT CTGTTGGACT 1740 
TACTTCACCC AAACTGGTAT GTCTGATGGG GGTGGAGTTC AAGATCAGGC AAGAGAAAAA 1800 
CATGTAAAAG AAGTAATCTC CCAACTCACC CGGGTACATG GCACCTCTAG CCCTACAAAG 1860 
15 GACTAGATCT CTCAAAACTA CATGAAACCC TCCGTACCCA TACTCGCCTG GTAAGCCTAT 1920 
TTAATACCAC CCTCACTGGG CTCCATGAGG TCTCGGCCCA AAACCCTACT AACTGTTGGA 1980 
TATGCCTCCC CCTGAACTTC AAGCCA 2006 

20 

<2) INFORMATIONS POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
25 (A) LONGUEUR: 1948 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

3 0 (11) TYPE DB MOLECULE: ARNm <en ADN) 

(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 

35 

ACTGCACTCT TCTGGTCCAT GTTTCTTACG GCTCGAGCTG AGCTTTTGCT CACCGTCCAC 60 

FEUILLE DE REMPLACEMENT (REGLE 26) 

wscociD: <wo_09oae9a*ij_> 
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11 

CACTGCTGTT TGCCACCACC GCANACCTGC CGCTGACTCC CATCCCTCTG GATCCTGCAG 120 

GGTGTCCGCT GTGCTCCTGA TCCAGCGAGG CGCCCATTGC CGCTCCCAAT TGGGCTAAAG 180 

5 

GCTTGCCATT GTNCCTGCAC GGCTAAGTGC CTGGGTTTGT TCTAATTGAG CTGAACACTA 240 

NTCACTGGGT TCCATGGTTC TCTTCTGTGA CCCACGGCTT CTAATAGAAC TATAACACTT 300 

10 ACCACATGGC CCAAGATTCC ATTCCTTGGA ATCCGTGAGG GCAAGAACTC CAGGTCAGAG 360 

AATACGAGGC TTGCCACCAT CTTGGAAGCG GCCTGCTACC ATCTTGGAAG TGGTTCACCA 420 

GCATCTTGGG AGCTCTGTGA GCAAGGACCC CCCGGTAACA TTTTGGCAAC CACGAACGGA 480 

15 

CATCCAAAGT GATACATCCT GGGAAGGACC CTACCCAGTC ATTTTATCTA CCCCAACTGC 540 

GGTTAAAGTG GCTGGAGTGG AGTCTTGGAT ACATCACACT TGAGTCAAAT CCTGGATACT 600 

20 GCCAAAGGAA CCTGAAAATC CAGGAGACAA CGCTAGCTAT TCCTGTGAAC CTCTAGAGGA 660 

TTTGCGCCTG CTCTTCAAAC AACAACCAGG AGGAAAGTAA CTAAAATCAT AAATCCCCAT 720 

GGCCCTCCCT TATCATATTT TTCTCTTTAC TGTTGTTTCA CCCTCTTTCA CTCTCACTGC 780 

25 

ACCCCCTCCA TGCCGCTGTA TGACCAGTAG CTCCCCTTAC CAAGAGTTTC TATGGAGAAT 840 

GCAGCGTCCC GGAAATATTG ATGCCCCATC GTATAGGAGT CTTTGTAAGG GAACCCCCAC 900 

30 CTTCACTGCC CACACCCATA TGCCCCGCAA CTGCTATCAC TCTGCCACTC TTTGCATGCA 960 

TGCAAATACT CATTATTGGA CAGGAAAAAT GATTAATCCT AGTTGTCCTG GAGGACTTGG 1020 

AGTCACTGTC TGTTGGACTT ACTTCACCCA AACTGGTATG TCTGATGGGG GTGGAGTTCA 1080 

35 

AGATCAGGCA AGAGAAAAAC ATGTAAAAGA AGTAATCTCC CAACTCACCC GGGTACATGG 1140 

FEUILLE DE REMPLACEMENT (REGLE 26) 

BNSDOCID: <WO_9902e9eA1J_> 
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12 

CACCTCTAGC CCCTACAAAG GACTAGATCT CTCAAAACTA CATGAAACCC TCCGTACCCA 1200 
TACTCGCCTG GTAAGCCTAT TTAATACCAC CCTCACTGGG CTCCATGAGG TCTCGGCCCA 1260 

5 

AAACCCTACT AACTGTTGGA TATGCCTCCC CCTGAACTTC AGGCCATATG TTTCAATCCC 1320 
TGTACCTGAA CAATGGAACA ACTTCAGCAC AGAAATAAAC ACCACTTCCG TTTTAGTAGG 1380 
10 ACCTCTTGTT TCCAATCTGG AA^TAACCCA TACCTCAAAC CTCACCTGTG TAAAATTTAG 1440 
CAATACTACA TACACAACCA ACTCCCAATG CATCAGGTGG GTAACTCCTC CCACACAAAT 1500 
AGTCTGCCTA CCCTCAGGAA TATTTTTTGT CTGTGGTACC TCAGCCTATC GTTGTTTGAA 1560 

15 

TGGCTCTTCA GAATCTATGT GCTTCCTCTC ATTCTTAGTG CCCCCTATGG CCATCTACAC 1620 
TGAACAAGAT TTATACAGTT ATGTCATATC TAAGCCCCGC AACAAAAGAG TACCCATTCT 1680 
20 TCCTTTTGTT ATAGGAGCAG GAGTGCTAGG TGCACTAGGT ACTGGCATTG GCGGTATCAC 1740 
AACCTCTACT CAGTTCTACT ACAAACTATC TCAAGAACTA AATGGGGACA TGGAACGGGT 1800 
CGCCGACTCC CTGGTCACCT TGCAAGATCA ACTTAACTCC CTAGCAGCAG TAGTCCTTCA 1860 
AAATCGAAGA GCTTTAGACT TGCTAACCGC TGAAAGAGGG GGAACCTGTT TATTTTTAGG 1920 
GGAAGAATGC TGTTATTATG TTAATCAA 1948 



25 



30 



(2) INFORMATIONS POUR LA SEQ ID NO: 6: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1136 paires de bases 
35 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 



FEUILLE DE REM PLACE WENT (REGLE 26) 

3NSOCCID: <WO_090a6S6Al_L> 
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13 

(D) CONFIGURATION: lin^aire 
(ii) TYPE DE MOLECULE: ARNm (en ADN) 
5 (iii) HYPOTHETIQUE: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 
CCATGGCCAT CTACACTGAA CAAGATTTAT ACAGTTATGT CATATCTAAG CCCCGCAACA 60 

10 

AAAGAGTACC CATTCTTCCT TTTGTTATAG GAGCAGGAGT GCTAGGTGCA CTAGGTACTG 120 
GCATTGGCGG TATCACAACC TCTACTCAGT TCTACTACAA ACTATCTCAA GAACTAAATG 180 
15 GGGACATGGA ACGGGTCGCC GACTCCCTGG TCACCTTGCA AGATCAACTT AACTCCCTAG 240 
CAGCAGTAGT CCTTCAAAAT CGAAGAGCTT TAGACTCGCT AACCGCTGAA AGAGGGGGAA 300 
CCTGTTTATT TTTAGGGGAA GAATGCTGTT ATTATGTTAA TCAATCCGGA ATCGTCACTG 360 

20 

AGAAAGTTAA AGAAATTCGA GATCGAATAC TUKCGTAGAGC AGAAGAGCTT CGAAACACTG 420 
GACCCTGGGG CCTCCTCAGC CAATGGATGC CCTGGATTCT CCCCTTCTTA GGACCTCTAG 480 
25 CAGCTATAAT ATTGCTACTC CTCTTTGGAC CCTGTATCTT TAACCTCCTT GTTAACTTTG 540 
TCTCTTCCAG AATCGAAGCT GTAAAACTAC AAATGGAGCC CAAGATGCAG TCCAAGACTA 600 
AGATCTACCG CAGACCCCTG GACCGGCCTG CTAGCCCACG ATCTGATGTT AATGACATCA 660 

30 

AAGGCACCCC TCCTGAGGAA ATCTCAGCTG CACAACCTCT ACTACGCCCC AATTCAGCAG 720 
GAAGCAGTTA GAGCGGTCGT CGGCCAACCT CCCCAACAGC ACTTAGGTTT TCCTGTTGAG 780 
35 ATGGGGGACT GAGAGACAGG ACTAGCTGGA TTTCCTAGGC TGACTAAGAA TCCCTAAGCC 840 

FEUILLE DE REMPLACEMENT (REGLE 26) 



BNSOOCID: <iWO_990a89eA1J_> 



wo 99/02696 PCT/FR98/01442' 
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TAGCTGGGAA GGTGACCACA TCCACCTTTA AACACGGGGC TTGCAACTTA GTTCACACCT 900 

GACCAATCAG AGAGCTCACT AAAATGCTAA TTAGGCAAAG ACAGGAGGTA AAGAAATAGC 960 

5 CAATCATCTA TTGCATGAGA GCACAGCAGG AGGGACAATG ATCGGGATAT AAACCCAAGT 1020 

CTTCGAGCCG GCAACGGCAA CCCCCTTTGG GTCCCCTCCC TTTGTATGGG AGCTCTGTTT 1080 

TCATGCTATT TCACTCTATT AAATCTTGCA GCTGCGAAAA AAAAAAAAAA AAAAAA 1136 

10 

(2) INFORMATIONS POUR LA SEQ ID NO: 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
15 (A) LONGUEUR: 2782 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

2 0 <ii) TYPE DE MOLECULE: ARNm <en ADN) 

(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7 

25 

ATGGGAGCTG TTTTCATGCT ATTTCACTCT ATTAAATCTT GCAACTGCAC TCTTCTGGTC 60 
CATGTTTCTT ACGGCTCGAG CTGAGCTTTT GCTCACCGTC CACCACTGCT GTTTGCCACC 120 
30 ACCGCA6ACC TGCCGCTGAC TCCCATCCCT CTGGATCCTG CAGGGTGTCC GCTGTGCTCC 180 
TGATCCA6CG AAGCGCCCAT TGCCGCTCCC AATTGGGCTA AAGGCTTGCC ATTGTTCCTG 240 
CACGGCTAAG TGCCTGGGTT TGTTCTAATT GAGCTGAACA CTAGTCACTG GGTTCCATGG 300 

35 

TTCTCTTCTG TGACCCACGG CTTCTAATAG AACTATAACA CTTACCACAT GGCCCAAGAT 360 

FEUILLE DE REMPLACEMENT (REGLE 26) 

SNSOCX^ID: <WO_0902e9eAlJ_> 
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15 

TCCATTCCTT GGAATCCGTG AGGCCAACGA ACTCCAGGTC AGAGAATACG AAGCTTGCCA 420 
CCATCTTGGA AGCGGCCTGC TACCATCTTG GAAGTGGTTC ACCACCATCT TGGGAGCTCT 480 

5 

GTGAGCAA6G ACCCCCCGGT GACATTTTGG CGACCACCAA CGGACATCCC AAGTGATACA 540 
TCCTGGGAAG GACCCTACCC AGTCATTTTA TCTACCCCAA CTGCGGTTAA AGTGGCTGGA 600 
10 GTGGAGTCTT GGATACATCA CACTTGAGTC AAATCCTGGA TACTGCCAAA GGAACCTGAA 660 
AATCCAGGAG ACAACGCTAG CTATTCCTGT GAACCTCTAG AGGATTTGCG CCTGCTCTTC 720 
AAACAACAAC CAGGAGGAAA GTAACTAAAA TCATAAATCC CCATGGGCCT CCCTTATCAT 780 

15 

ATTTTTCTCT GTAGTGTTCT TTCACCCTGT TTCACTCTCA CTGCACCCCC TCCATGCCGC 840 
TGTATGACCA GTAGCTCCCC TCACCCAGAG TTTCTATGGA GAATGCAGCG TCCCGGAAAT 900 
20 ATTGATGCCC CATCGTATAG GAGTCTTTCT AAGGGAACCC CCACCTTCAC TGCCCACACC 960 
CATATGCCCC GCAACTGCTA TCACTCTGCC ACTCTTTGCA TGCATGCAAA TACTCATTAT 1020 
TGGACAGGAA AAATGATTAA TCCTAGTTGT CCTGGAGGAC TTGGAGTCAC TGTCTGTTGG 1080 

25 

ACTTACTTCA CCCAAACTGG TATGTCTGAT GGGGGTGGAG TTCAAGATCA GGCAAGAGAA 1140 
AAACATGTAA AAGAAGTAAT CTCCCAACTC ACCGGGGTAC ATGGCACCTC TAGCCCCTAC 1200' 
3 0 AAAGGACTAG ATCTCTCAAA ACTACATGAA ACCCTCCGTA CCCATACTCG CCTGGTAAGC 1260 
CTATTTAATA CCACCCTCAC TGGGCTCCAT GAGGTCTCGG CCCAAAACCC TACTAACTGT 1320 
TGGATATGCC TCCCCCTGAA CTTCAGGCCA TATGTTTCAA TCCCTGTACC TGAACAATGG 1380 
AACAACTTCA GCACAGAAAT AAACACCACT TCCGTTTTAG TAGGACCTCT TGTTTCCAAT 1440 



35 



FEUILLE DE REMPLACEMENT (REGLE 26) 

BNSEX3CID: <WOL_9902e96A1 J_> 
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GTGGAAATAA CCCATACCTC AAACCTCACC TGTGTAAAAT TTAGCAATAC TACATACACA 1500 
ACCAACTCCC AATGCATCAG GTGGGTAACT CCTCCCACAC AAATAGTCTG CCTACCCTCA 1560 

5 

GGAATAT.TTT TTGTCTGTGG TACCTCAGCC TATCGTTGTT TGAATGGCTC TTCAGAATCT 1620 
ATGTGCTTCC TCTCATTCTT AGTGCCCCCT ATGACCATCT ACACTGAACA AGATTTATAC 1680 
10 AGTTATGTCA TATCTAAGCC CCGCAACAAA AGAGTACCCA TTCTTCCTTT TGTTATAGGA. 1740 
GCAGGAGTGC TAGGTGCACT AGGTACTGGC ATTGGCGGTA TCACAACCTC TACTCAGTTC 1800 
TACTACAAAC TATCTCAAGA ACTAAATGGG GACATGGAAC GGGTCGCCGA CTCCCTGGTC 1860 

15 

ACCTTGCAAG ATCAACTTAA CTCCCTAGCA GCAGTAGTCC TTCGAAATCG AAGAGCTTTA 1920 
GACTTGCTAA CCGCTGAGAG AGGGGGAACC TGTTTATTTT TAGGGGAAGA ATGCTGTTAT 1980 
20 TATGTTAATC AATCCGGAAT CGTCACTGAG AAAGTTGAAG AAATTCCAGA TCGAATACAA 2040 
CGTATAGCAG AGGAGCTTCG AAACACTGGA CCCTGGGGCC TCCTCAGCCG ATGGATGCCC 2100 
TGGATTCTCC CCTTCTTAGG ACCTCTAGCA GCTATAATAT TGCTACTCCT CTTTGGACCC 2160 



25 



35 



TGTATCTTTG ACCTCCTTGT TAACTTTGTC TCTTCCAGAA TCGAAGCTGT GAAACTACAA 2220 



ATG6AGCCCA AGATGCAGTC CAAGACTAAG ATCTACCGCA GACCCCTGGA CCGGCCTGCT 2280 
30 AGCCCACGAT CTGATGTTAA TGACATCAAA GGCACCCCTC CTGAGGAAAT CTCAGCTGCA 2340 
CAACCTCTAC TACGCCCCAA TTCAGCAGGA AGCAGTTAGA GCGGTGGTCG GCCAACCTCC 2400 



CCAACAGCAC TTAGGTTTTC CTGTTGAGAT GGGGGACTGA GAGACAGGAC TAGCTGGATT 2460 



TCCTAGGCTG ACTAAGAATC CTTAAGCCTA GGTGGGAAGG TGACCACATC CACCTTTAAA 2520 



FEUILLE DE REMPLACEMENT (REGLE 26) 

aWSDOCID: cWO_990269aA1J_> 
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CACGGGGCTT GCAACTTAGC TCACACCTGA CCAATCAGAG AGCTCACTAA AATGCTAATT 2 580 

AGGCAAAGAC AGGAGGTAAA GAAATAGCCA ATCATTTATT GCCTGAGAGC ACAGCAGGAG 2640 

5 

GGACAATGAT CGGGATATAA ACCCAAGTTT TCGAGCCGGC AACGGCAACC CCCTTTGGGT 2700 

CCCCTCCCTT TGTATGGGAG CTCTGTTTTC ATGCTATTTC ACTCTATTAA ATCTTGCAAC 2760 

10 TGCAAAAAAA AA7UVAAAAAA AA 2782 

(2) INFORMATIONS POUR LA SEQ ID NO: 8: 

15 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 666 pa ires de bases * 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

20 

(ii) TYPE DE MOLECULE: ARNm (en ADN) 
(iii) HYPOTHETIQUE : NON 
25 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8: 

TGTCCGCTGT GCTCCTGATC CAGCGAGGCG CCCATTGCCG CTCCCAATTG GGCTAAAGGC 60 
TTGCCATTGT TCCTGCACGG CTAAGTGCCT GGGTTTGTTC TAATTGAGCT GAACACTANT 120 

30 

CACTGGGTTC CATGGTTCTC TTCTGTGACC CACGGCTTCT AATATAACTA TAACACTTAC 180 
CACATGGCCC AAGATTCCAT TCCTTGGAAT CCGTGAGGCC AAGAACTCCA GGTCAGAGAA 240 
35 TACGAGGCTT GCCACCATCT TGGAAGCGGC CTGCTACCAT CTTGGAAGTG GTTCACCACC 300 



FEUILLE DE REMPLACEMENT (REGLE 26) 



BNSOOCIO: <WO_9902e9eAlJ_> 



10 
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ATCTTGGGAG CTCTGTGAGC AAGGACCCCC CGGTAACATT TTGGCAACCA CGAACGGACA 360 

TCCAAAGTGA ATCGAAGCTG TAAAACTACA AATGGAGCCC AAGATGCAGT CCAAGACTAA 420 

5 GATCTACCGC AGACCCCTGG ACCGGCCTGC TAGCCCACGA TCTGATGTTA ATGACATCAA 480 

AGGCACCCCT CCTGAGGAAA TCTCAGCTGC ACAACCTCTA CTACGCCCCA ATTCAGCAGG 540 

AAGCAGTTAG AGCGGTCGTC GGCCAACCTC CCCAACAGCA CTTAGGTTTT CCTGTTGAGA 600 

TGGGGGACTG AGAGACAGGA CTAGCTGGAT TTCCTAGGCT GACTAAGAAT CCCTAAGCCT 660 



15 



25 



35 



AGCTGG 



(2) INFORMATIONS POUR LA SEQ ID NO: 9: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 3372 paires de bases 
20 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



666 



(ii) TYPE DE MOLECULE: ARNm (en ADN ) 
(iii) HYPOTHETIQUE: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 9: 

30 GACTTCCCAA ATACCAGAGG AAGCAGAGTG GTTTACAGTC CTGGACCTTC AGGATGCCTT 60 

CTTCTGCATC CCTGTACATC CTGACTCTCA ATTCTTGTTT GCCTTTGAAG ATACTTCAAA 120 

CCCAGCATCT CAACTCACCT GGACTATTTT ACCCCAAGGG TTCAGGGATA GTCCCCATCT 180 

ATTTGGCCAG GCATTAGCCC AAGACTTGAG CCAATCCTCA TACCTGGACA CTTGTCCTTC 240 



FEUILLE DE REMPLACEMENT (REGLE 26) 

3NSOOCID: <WO_990a89eAl_l_> 
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19 



GGTAGGTGGA TGATTTACTT TTGGCCGCCC ATTCAGAAAC CTTGTGCCAT CAAGCCACCC 300 



AAGCGCTCTT CAATTTCCTC GCTACCTGTG GCTACATGGT TTCCAAACCA AAGGCTCAAC 360 



TCTGCTCACA GCAGGTTACT TAGGGCTAAA ATTATCCAAA GGCACCAGGG CCCTCAGTGA 420 



GGAACACATC CAGCCTATAC TGGCTTATCC TCATCCCAAA ACCCTAAAGC AACTAAGGGG 480 



10 ATTCCTTGGC GTAATAGGTT TCTGCCGAAA ATGGATTCCC AGGTATGGCG AAATAGCCAG 540 



GTCATTAAAT ACACTAATTA AGGAAACTCA GAAAGCCAAT ACCCATTTAG TAAGATGGAC 600 



AACTGAAGTA GAAGTGGCTT TCCAGGCCCT AACCCAAGCC CCAGTGTTAA GTTTGCCAAC 660 

15 

AGGGCAAGAC TTTTGTTCAT ATGTCACAGA AAAAACAGGA ATAGCTCTAG GAGTCCTTAC 720 

ACAGATCC6A GGGATGAGCT TGCAACCTGT GGCACACCTG ACTAAGGAAA TTGATGTAGT 780 



20 GGCAAAGGGT TGACCTCATT GTTTACGGGT AGTGGTGGCA GTAGCAGTCT TAGTATCTGA 840 



AGCAGTTAAA ATAATACAGG GAAGAGATCT TACTGTGTGG ACATCTCATG ATGTGAATGG 900 



25 



35 



CATACTCACT GCTAAAGGAG ACTTGTGGCT GTCAGACAAC TGTTTACTTA AATGTCAGGC 960 



TCTATTACTT GAAGGGCCAG TGCTGCGACT GTGCACTTGT GCAACTCTTA ACCCAGCCAC 1020 



ATTTCTTCCA GACAATGAAG AAAAGATAAA ACATAACTGT CAACAAGTAA TTTCTCAAAC 1080 
30 CTATGCCACT CX5AGGGGACC TTTTAGAGGT TCCTTTGACT GATCCCGACC TCAACTTGTA 1140 
TACTGATGGA AGTTCCTTTG TAGAAAAAGG ACTTCGAAAA GTGGGGTATG CAGTGGTCAG 1200 



TGATAATGGA ATACTTGAAA GTAATCCCCT CACTCCAGGA ACTAGTGCTC AGCTAGCAGA 1260 



ACTAATAGCC CTCACTTGGG CACTAGAATT AGGAGAAGAA AAAAGGGCAA ATATAATACA 1320 



FEUILLE DE REMPLACEMENT (REGLE 26) 

BNSOCXSID: <WO_990269eA1J_> 
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GACTCTAAAT ATGCTTACCT AGTCCTCCAT GCCCATGCAG CAATATGGAA AGAAAGGGAA 1380 
TTCCTAACTT CTGAGAGAAC ACCTATCAAA CATCAGGAAG CCATTAGGAA ATTATTATTG 1440 

5 

GCTGTACAGA AACCTAGAGA GGTGGCAGTC TTACACTGCC GGGGTCATCA CAAAGGAAAG 1500 
GAAAGGGAAA TACAAGAGAA CTGCCAAGCA TATATTGAAG CCAAAAGAGC TGCAAGGCAG 1560 
10 GACCCTCCAT TAGAAATGCT TATTAAACTT CCCTTAGTAT AGGGTAATCC CTTCCGGGAA 1.620 
ACCAAGCCCC AGTACTCAGC AGGAGAAACA GAATGGGGAA CCTCACGAGG CAGTTTTCTC 1680 
CCCTCGGGAC GGTTAGCCAC TGAAGAAGGG AAAATACTTT TGCCTGCAAC TATCCAATGG 1740 

15 

AAATTACTTA AAACCCTTCA TCAAACCTTT CACTTAGGCA TCGATAGCAC CCATCAGATG 1800 
GCCAAATCAT TATTTACTGG ACCAGGCCTT TTCAAAACTA TCAAGCAGAT AGTCAGGGCC 1860 
20 TGTGAAGTGT GCCAGAGAAA TAATCCCCTG CCTTATCGCC AAGCTCCTTC AGGAGAACAA 1920 
AGAACAG6CC ATTACCCTGG AGAAGACTGG CAACTGATTT TACCCACAAG CCCAAACCTC 1980 



25 



35 



AGGGATTTCA GTATCTACTA GTCTGGGTAG ATACTTTCAC GGGTTGGGCA GAGGCCTTCC 2040 



CCTGTAGGAC AGAAAAGGCC CAAGAGGTAA TAAAGGCACT AGTTCATGAA ATAATTCCCA 2100 
GATTCGGACT TCCCCGAGGC TTACAGAGTG ACAATAGCCC TGCTTTCCAG GCCACAGTAA 2160 
30 CCCAGGGAGT ATCCCAGGCG TTAGGTATAC GATATCACTT ACACTGCGCC TGAAGGCCAC 2220 
AGTCCTCAGG GAAG6TCGAG AAAATGAATG AAACACTCAA AGGACATCTA AAAAAGCAAA 2280 
CCCAGGAAAC CCACCTCACA TGGCCTGTTC TGTTGCCTAT AGCCTTAAAA AGAATCTGCA 2340 



ACTTTCCCCA AAAAGCAGGA CTTAGCCCAT ACGAAATGCT GTATGGAAGG CCCTTCATAA 2400 



FEUILLE DE REMPLACEWIENT {REGLE 26) 

JNSDOCID: <WO_O90289eA1J_> 



wo 99/02696 PCT/FR98/01442 

21 

CCAATGACCT TGTGCTTGAC CCAAGACAGC CAACTTAGTT GCAGACATCA CCTCCTTAGC 2460 
CAAATATCAA CAAGTTCTTA AAACATTACA AGG7U\CCTAT CCCTGAGAAG AGGAAAAGAA 2520 

5 

TATTCCACCC AAGTGACATG GTATTAGTCA AGTCCCTTCC CTCTAATTCC CCATCCCTAG 2580 
ATACATCCTG GGAAGGACCC TACCCAGTCA TTTTATCTAC CCCAACTGCG GTTAAAGTGG 2640 
10 CTGGAGTGGA GTCTTGGATA CATCACACTT GAGTCAAATC CTGGATACTG CCAAAGGAAC 2700 
CTGTU^AATCC AGGAGACAAC GCTAGCTATT CCTGTGAACC TCTAGAGGAT TTGCGCCTGC 27 60 
TCTTCAAACA ACAACCAGGA GGAAAAATCG AAGCTGTAAA ACTACAAATG GAGCCCAAGA 2820 

15 

TGCAGTCCAA GACTAAGATC TACCGCAGAC CCCTGGACCG GCCTGTTAGC CCACGATCTG 2880 
ATGTTAATGA CATCAAAGGC ACCCCTCCTG AGGAAATCTC AGCTGCACAA CCTCTACTAC 2940 >- 
20 GCCCCAATTC AGCAGGAAGC AGTTAGAGCG GTCGTCGGCC AACCTCCCCA ACAGCACTTA 3000 
GGTTTTCCTG TTGAGATGGG GGACTGAGAG ACAGGACTAG CTGGATTTCC TAGGCTGATT 3060 
AAGAATCCCT AAGCCTAGCT GGGAAGGTGA CCACATCCAC CTTTAAACAC GGGGCTTGCA 3120 

25 

ACTTAGCTCA CACCTGACCA ATCAGAGAGC TCACTAAAAT GCTAATTAGG CAAAGACAGG 3180 
AGGTAAAGAA ATAGCCAATC ATTTATTGCC TGAGAGCAGA GCAGGAGGGA CAATGATCGG 3240 
30 GATATAAACC C7VAGTTTTCG AGCCGGCAAC GGCAACCCCC TTTGGGTCCC CTCCCTTTGT 3300 
ATGGGAGCTC TGTTTTCATG CTATTTCACT CTATTAAATC TTGCAACTGC AAAAAAAAAA 3360 



35 



AAAAAAAAAA AA 



3372 



FEUILLE DE REMPLACEMENT (REGLE 26) 

BNSOOCID: <WO 9002696At L> 



wo 99/02696 



PCT/FR98/01442 



22 

(2) INFORMATIONS POUR LA SEQ ID NO: 10: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2372 paires de bases 
5 (B) TYPE: nucleotide 

(C) NOMBRE DB BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ARNm (en ADN) 

10 

(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 
15 ACTGCACTCT TCTGGTCCAT GTTTCTTACG GCTCGAGCTG AGCTTTTGCT CACCGTCCAC 60 
CACTGCTGTT TGCCACCACC GCAGACCTGC CGCTGACTCC CATCCCTCTG GATCCTGCAG 120 
GGTGTCCGCT GTGCTCCTGA TCCAGCGAGG CGCCCATTGC CGCTCCCAAT TGGGCTAAAG 180 

20 

GCTTGCCATT GTTCCTGCAC GGCTAAGTGC CTGGGTTTGT TCTAATTGAG CTGAACACTA 240 
ATCACTGGGT TCCATGGTTC TCTTCTGTGA CCCACGGCTT CTAATAGAAC TATAACACTT 300 
25 ACCACATGGC CCAAGATTCC ATTCCTTGGA ATCCGTGAGG CCAAGAACTC CAGGTCAGAG 360 
AATACGAGGC TTGCCACCAT CTTGGAAGCG GCCTGCTACC GTCTTGGAAG TGGTTCACCA 420 
CCATCTTGGG AGCTCTGTGA GCAAGGACCC CCCGGTAACA TTTTGGCAAC CAACGACGGA 480 

30 

CATCCAAAGT GATGGGAAAC GTTCCCCGCA AGACAAAAAC GCCCCTAAGA CGTATTCTGG 540 
AGT^TTGGGA CCAATTTGAC CCTCAGACAC TAAGAAAGAA ACGACTTATA TTCTTCTGCA 600 
35 GTGCCGCCTG GCACTCCTGA GGGAAGTATA AATTATAACA CCATCTTACA GCTAGACCTC 660 
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TTTTGTAGAA AAGGCAAATG GAGTGAAGTG CCATAAGTAC AAACTTTCTT TTCATTAAGA 7 20 
GACAACTCAC AATTATGTAA AAAGTGTGAT TTATGCCCTA CAGGAAGCCT TCAGAGTCTA 780 
5 CCTCCCTATC CCAGCATCCC CGACTCCTTC CCCAACTAAT AAGGACCCCC CTTCAACCCA 840 
AATGGTCCAA AAGGAGATAG ACTVAAAGGGT AAACAGTGAA CCAAAGAGTG CCAATATTCC 900 
CCAATTATGA CCCCTCCAAG CAGTGGGAGG AAGAGAATTC GGCCCAGCCA GAGTGCATGT 960 

10 

GCCTTTTTCT CTCCCAGACT TAAAGCAAAT AAAAACAGAC TTAGGTAAAT TCTCAGATAA 1020 
CCCTGATGGC TATATTGATG TTTTACAAGG GTTAGGACAA TTCTTTGATC TGACATGGAG 1080 
15 AGATATAATG TCACTGCTAA ATCAGACACT AACCCCAAAT GAGAGAAGTG CCACCATAAC 1140-^ 
TGCAGCCTGA GGGTTTGGCG TCTCTGGTAT CTCAGTCAGG TCAATGGATA NGGATGACAA 1200 
CAGAAGGAAA GANAATGATT CCCCACAGGC CAGCAGGCAG TTCCCAGTCT AGACCCTCAT 1260 

20 

TGGGACACAG AATCAGAACA TGGAGATTGG TGCTGCAGAC ATTTGCTAAC TTGTGTGCTA 1320' 
GAAGGACTAA GGAAAACTAG GAAGAAGTCT ATGAATTACT CAATGATGTC CACCATAACA 1380 
25 CAGGGAAGGG AAGAAAATCC TACTGCCTTT CTGGAGAGAC TAAGGGAGGC ATTGAGGAAG 1440 
CGTGCCTCTC TGTCACCTGA CTCTTCTGAA GGCCAACTAA TCTTAAAGCG TAAGTTTATC 1500 
ACTCAGTCAG CTGCAGACAT TAGAAAAAAC TTCAAAAGTC TGCCGTAGGC CCGGAGCAAA 1560 

30 

ACTTAGAAAC CCTATTGAAC TTGGCAACCT CGGTTTTTTA TAATAGAGAT CAGGAGGAGC 1620 
AGGCGGAACA GGACAAACGG GATTAAAAAA AAGGCCACCG CTTTAGTCAT GACCCTCAGG 1680 
35 CAAGTGGACT TTGGAGGCTC TGGAAAAGGG AAAAGCTGGG CAAATTGAAT GCCTAATAGG 1740 
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GCTTGCTTCC AGTGCGGTCT ACAAGGACAC TTTAAAAAAG ATTGTCCAAG TAGAAGTAAG 1800 
CCGCCCCTTC GTCCATGCCC CTTATTTCAA GGGAATCACT GGAAGGCCCA CTGCCCCAGG 1860 
5 GGACAAAGGT CTTTTGAGTC AGAAGCCACT AACCAGATGA TCCAGCAGCA GGACTGAGGG 1920 
TGCCTGGGGC AAGCGCCATC CCATGCCATC ACCCTCACAG AGCCCTGGGT ATGCTTGACC 1980 
ATTGAGGGCC AGGAAGGTTG TCTCCTGGAC ACTGGTGCGG TCTTCTTAGT CTTACTCTTC 2040 
TGTCCCGGAC AACTGTCCTC CAGATCTGTC ACTATTCTGA GGGGGTCCNT AAGACGGGCA 2100 
GTCACTAGAT ACTTTTTCCC AGCCACTAAG TTATGAACTG GGGAGCTTTA TTCTTTTCAC 2160 
15 ATGCTTTTCT AATTATGCTT GAAAGCCCCA CTACCTTGTT AGGGAGAGAC ATTCTAGCAA 2220 
AAGCAGGGGC CATTATACAC CTGAACATAG GAGAAGGAAC ACCCGTTTGT TGTNCCCCTG 2280 
CTTGAGGAAG GAATTAATCC TGAAGTCTGG GCAACAGAAG GACAATATGG ACGAGCCAAA 2340 
GAATGCCCGT CCTGTTCAAG TTAAACTAAA GG 2372 



10 



20 



(2) INFORMATIONS POUR LA SEQ ID NO; 11: 



25 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 7582 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple ... 
30 (D) CONFIGURATION: linSaire 

(ii) TYPE DE MOLECULE: ARNm (en ADN) 

(iii) HYPOTHETIQUE : NON 

35 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 

FEUILLE DE REMPLACEMENT (REGLE 26) 
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CAACAATCGG 


GAffATAAACC 


CAGGCATTCG 


AGCTGGCAAC 


AGCAGCCCCC 


CTTTGGGTCC 


60 




CTTCCCTTTG 


mTGGGAGCT 


GTTTTCATGC 


TATTTCACTC 


TATTAAATCT 


TGCAACTGCA 


120 




CTCTTCTGGT 


CCATGTTTCT 


TACGGCTCGA 


GCTGAGCTTT 


TGCTCACCGT 


CCACCACTGC 


180 


5 


TGTTTGCCAC 


CACCGCANAC 


CTGCCGCTGA 


CTCCCATCCC 


TCTGGATCCT 


GCAGGGTGTC 


240 




CGCTGTGCTC 


CTGATCCAGC 


GARGCGCCCA 


TTGCCGCTCC 


CAATTGGGCT 


AAAGGCTTGC 


300 




CATTGTNCCT 


GCACGGCTAA 


GTGCCTGGGT 


TTGTTCTAAT 


TGAGCTGAAC 


ACTANTCACT 


360 




GGGTTCCATG 


GTTCTCTTCT 


GTGACCCACG 


GCTTCTAATA 


KAACTATAAC 


ACTTACCACA 


420 




TGGCCCAAGA 


TTCCATTCCT 


TGGAATCCGT 


GAGGSCAACG 


AACTCCAGGT 


CAGAGAATAC 


480 


10 


GARGCTTG CC 


ACCATCTTGG 


AAGCGGCCTG 


CTACCRTCTT 


GGAAGTGGTT 


CACCACCATC 


540 




TTGGGAGCTC 


TGTGAGCAAG 


GACCCCCCGG 


TRACATTTTG 


GCRACCAMSR 


ACGGACATCC 


600 




MAAGTGATGG 


GAAACGTTCC 


CCGCAAGACA 


AAAACGCCCC 


TAAGACGTAT 


TCTGGARAAT 


660 




TGGG7U4CAAT 


TTGACCCTCA 


GACACTAAGA 


AAGAAACGAC 


TTATATTCTT 


CTGCAGTGCC 


720 




GCCTGGCACT 


CCTGAGGGAA 


GTATAAATTA 


TAACACCATC 


TTACAGCTAG 


ACYTCTTTTG 


780 


15 


TAGAAAAGGC 


AAATGGAGTG 


AAGTGCCATA 


AGTACAAACT 


TTCTTTTCAT 


TAAGAGACAA 


840 -S 




CTCACAATTA 


TGTAAAAAGT 


GTGATTTATG 


CCCTACAGGA 


AGCCTTCAGA 


GTCTACCTCC 


900 




CTATCCCAGC 


ATCCCCGACT 


CCTTCCCCAM 


YTAATAAGGA 


CCCCCCTTCA 


ACCCAAATGG 


960 




TCCAAAAGGA 


GATAGACAAA 


AGGGTAAACA 


GTGAACCAAA 


GAGTGCCAAT 


ATTCCCCAAT 


1020 




TATGACCCCT 


CCCAAGCAGT 


GGGAGGAAGA 


GAATTCGGCC 


CAGCCAGAGT 


GCATGTGCYT 


1080 A 


20 


TTTYYTCTCC 


CAGACTTAAA 


GCAAATAAAA 


ACAGACTTAG 


GTAAATTCTC 


AGATAAYCCT 


1140 




GATGGCTATA 


TTGRTGTTTT 


ACAAGGGTTA 


GGACAATTCT 


TTGATCTGAC 


ATGGAGAGAT 


1200 • 




ATATATGTCA 


CTGCTAAATC 


AGACACTAAC 


CCCAAATGAG 


AG7VACTGCCA 


CCATAACTGC 


1260 




AGCCT6AGRG 


TTTGGCGATC 


TCTGGTATCT 


CAGTCAGGTC 


AATGGATANG 


GATGACAACA 


1320 




GAAGGAAAGA 


NAATGATTCC 


CCACAGGCCA 


GCARGCAGTT 


CCCAGTCTAS 


ACCCTCATTG 


1380 


25 


GGGACACAGA 


AATCAGTAAC 


ATGGGAGATT 


GGTGCTGCAG 


ACATTTGCTA 


ACTTGTGTGC 


1440 




TASAAGGACT 


AAGGAAAACT 


ASGAAGAAAR 


TCTAYGAATT 


ACTCAATGAT 


GTCCACCATA 


1500 




ACACAGGGGA 


AGGGAAGAAA 


ATCCTACTGC 


CTTTCTGGAG 


AGACTAAGGG 


AGGCATTGAG 


1560 




GAAGCGTGCC 


TCTCTGTCAC 


CTGACTCTTC 


TGAAGGCCAA 


CTAATCTTAA 


AGCGTAAGTT 


1620 




TATCACTCAG 


TCAGCTGCAG 


ACATTAGAAA 


AAACTTCAAA 


AGTCTGCCGT 


AGGCCCGGAG 


1680 


30 


CAAAACTTA6 


AAACCCTATT 


GAACTTGGCA 


ACYTCGGTTT 


TTTATAATAG 


AGATCAGGAG 


1740 




GAGCAGGCGG 


AACAGGACAA 


ACGGGATTAA 


AAAAAAGGCC 


ACCGCTTTAG 


TCATGACCCT 


1800 




CAGGCAAGTG 


GACTTTGGAG 


GCTCTGGAAA 


AGGGAAAAGC 


TGGGCAAATT 


GAATGCCTAA 


1860 




TAGGGCTTGC 


TTCCAGTGCG 


GTCTACAAGG 


ACACTTTAAA 


AAAGATTGTC 


CAAGTAGAAG 


1920 




TAA6CC6CCC 


CTTCGTCCAT 


GCCCCTTATT 


TCAAGGGAAT 


CACT6GAAGG 


CCCACTGCCC 


1980 


35 


CAGGGGACAA 


AGGTCTTTTG 


AGTCAGAAGC 


CACTAACCAG 


ATGATCCAGC 


AGCAGGACTG 


2040 




AGGGTGCCTG 


GGGCAAGCGC 


CATCCCATGC 


CATCACCCTC 


ACAGAGCCCT 


GGGTATGCTT 


2100 
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GACCATTGAG 


GGCCAGGAAG 


GTTGTCTCCT 


GGACACTGGT 


GCGGTCTTCT 


TAGTCTTACT 


2160 




CTTCTGTCCC 


GGACAACTGT 


CCTCCAGATC 


TGTCACTATT 


CTGAGGGGGT 


CCNTAAGACG 


2220 




GGCAGTCACT 


AGATACTTTY 


TCCCAGCCAC 


TAAGTTATGA 


ACTGGGGAGC 


TTTATTCTTT 


2280 




TCACATGCTT 


TTCTAATTAT 


GCTTGAAAGC 


CCCACTACCT 


TGTTAGGGAG 


AGACATTCTA 


2340 


5 


GCAAAAGCAG 


GGGCCATTAT 


ACACCTGAAC 


ATAGGAGAAG 


GAACACCCGT 


TTGTTGTNCC 


2400 




CCTGCTTGAG 


GAAGGAATTA 


ATCCTGAAGT 


CTGGGCAACA 


GAAGGACAAT 


ATGGACGAGC 


2460 




CAAAGAATGC 


CCGTCCTGTT 


CAAGTTAAAC 


TAAAGGATTC 


CACTTCCTTT 


CCCTACCAAA 


2520 




GGCAGTACCC 


CCTCAGACCC 


AAGGCCCAAC 


AAGGATTCCA 


AAAGATTGTT 


AAGGACTTAA 


2580 




AAGCCCAAGG 


CTTAGTAAAA 


CCATGCATAA 


CTCCCTGCAG 


TAATTCCGTA 


GTGGATTGAG 


2640 


10 


GAGGCACAGA 


AACCCAGTGG 


ACAGTGGAGG 


GTTAGTGCAA 


GATCTCAGGA 


TTATCAATGG 


2700 




AGGCCGTTGT 


CCTTTTATAC 


CCAGCTGTAC 


CTAGCCCTTA 


TACTGTGMYT 


TCCCAAATAC 


2760 




CAGAGGAAGC 


AGAGTGGTTT 


ACASTCCTGG 


accttmagga" 


TGCCTTCTTC 


TGCATCCCTG 


2820 




TACATCCTGA 


CTCTCAATTC 


TTGTTTGCCT 


TTGAAGATAC 
— J 


TTCAAACCCA 


RCATCTCAAC 


2880 




TCACCTGGAC 


TRTTTTACCC 


CAAGGGTTCA 


gggatagycc 


CCATCTATTT 


GGCCAGGCAT 


2940 


15 


TAGCCCAAGA 


CTTGAGYCAR 


TYMTCATACC 


tggacactct 


TGTCCTTCRG 


TAKGTGGATG 


3000 




ATTTACTTTT 


RGCYGCCYRT 


TCAGAAACCT 


TGTGCCATCA 


AGCCACCCAA 


GCRCTCTTMA 


3060 




ATTTCCTCG C 


YACCTGTGGC 


TACAWGGTTT 


CCAAACSARA 


RGCTCARCTC 


TGCTCACAGC 


3120 




AGGTTAAATA 


CTTAGGRCTA 


ARATTATCCA 


AAGGCACCAR 


GGCCCTCAGT 


GAGGAAYRYA 


3180 




TCCAGCCTAT 


ACTGGCTTAT 


CCTCATCYCA 


AAACCCTAAA 


GCAACTAAGR 


GRRTTCCTTG 


3240 


20 


GCRTAAYAGG 


YTTCTGCCGA 


AWATGGATTC 


CCCAGGTWTG 


GCRAAATAGC 


CAGGYCATTA 


3300 




WATACASTAA 


TTAAGGAAAC 


TCAGAAAGCC 


AATACCCATT 


TARTAAGATG 


GAYAMCTGAA 


3360 




GYMRAAGTGG 


CTTTCCAGGC 


CCCTAAAGAA 


GGCCTTAAAC 


CCAAGYCCCA 


GTGTTAAGYT 


3420 




TGCCAACRGG 


GCAAGACTTT 


TSTTYATAYR 


TCACAGAAAA 


AAACAGRAAY 


AGCTCTRGGA 


3480 




GTCCTTACAC 


AGRTCCRAGG 


GAYGAGCTTG 


CAACCYRTGG 


CRYACCTGAS 


TAAGG/VAAYT 


3540 


25 


GATGTAGTGG 


CAAAGGGTTG 


RCYTCATTGT 


TTAYGGGTAG 


TGGTGGCAGT 


AGCAGTYKTA 


3600 




GTATCTGAAG 


CAGTTAAAAT 


AATACAGGGR 


AGAGATCTTA 


CTGTGTGGAC 


ATCTCATGAK 


3660 




GTGAAYRGCA 


TACTCACTGC 


TAAAGGAGAC 


TTGTGGCTGT 


CAGACAACYG 


TTTACTTAAA 


3720 




TRTCAGGCTC 


TATTACTTGA 


ARGGCCAGTG 


CTGCRACTGT 


GCACTTGTGC 


AACTCTTAAC 


3780 




CCAGYCNCAT 


TTCTTCCAGA 


CAATGAAGAA 


AAGATARAAY 


ATAACTGTCA 


ACAARTAATT 


3840- 


30 


TCTCAAACCT 


ATGCCACTCG 


AGGGGACCTT 


YTAGARGTTC 


CYTTGACTGA 


TCCYGACCTT 


3900 




CAACTTGTAT 


ACTGATGGAA 


GTTCCTTTGT 


AGAAAAAGGA 


CTTCGAAAAG 


YGGGGTATGC 


3960 




AGTGGTCAGT 


GATAATGGAA 


TAYTTGAAAG 


TAATCCCCTC 


ACTCCAGGAA 


CTAGTGCTYA 


4020 




GCTRGCAGAA 


CTAATAGCCY 


TCAYTKGGGC 


ACTAGAATTA 


GGAGAAGRAA 


AAAGGGYAAA 


4080 




TATATATACA 


GACTCTRART 


ATGCTYACCT 


AGTCNTCCAT 


GCCCATGMRG 


CAATATGSAR 


4140 


35 


AGAAAGGGAA 


TTCCTAACTT 


CYGAGRG7UVC 


ACCTATCAMA 


CATCAGGAAG 


CCATTAGGAR 


4200 




ATTATTAYTG 


GCWGTACAGA 


AACCTARAGA 


GGTGGMAGTC 


TTACACTGCY 


GGGGTCATCA 


4260 
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NAAAGGAAAG RAAAGGGAAA TASAAGRGAA 
TGCAAGGCAG GACCCTCCAT TAGAAATGCT 
CTTCCGGGAA ACCAAGCCCC AGTACTCAGC 
CAGTTTTCTC CCCTCGGGAC GGTTAGCCAC 
5 TATCCAATGG AAATTACTTA AAACCCTTCA 
CCATCARATG GCCAAATCAT TATTTACTGG 
AKTCAGGGCC TGTGAAKTGT GCCARARAAA 
AGGARAACAA ARAACAGGCC ATTACCCTGR 
CCCAAACCTC AGGGATTTCA GTATCTACTA 

10 RAGGCCTTCC CCTGTAGGAC AGAAAAGGCC 
ATAATTCCCA GATTCGGACT TCCCCGAGGC 
GCCACAGTAA CCCAGGGAGT ATCCCAGGCG 
TGAAGGCCAC AGTCCTCAGG GAAGGTCGAG 
AAAAAGCAAA CCCAGGAAAC CCACCTCACA 

15 AGAATCTGCA ACTTTCCCCA AAAAGCAGGA 
CCCTTCATAA CCAATGACCT TGTGCTTGAC 
CCTCCTTAGC CAAATATCAA CAAGTTCTTA 
AGGGAAAA6A ACTATTCCAC CCWWGTGACA 
CCCCATCCCT AGATACATCC TGGGAAGGAC 

20 CGGTTAAAGT GGCTGGAGTG GAGTCTTGGA 
TGCCAAAGGA ACCTGAAAAT CCAGGAGACA 
ATTTGCGCCT GCTCTTCAAA CAACAACCAG 
ATGGSCCTCC CTTATCATAT TTTTCTCTKT 
GCACCCCCTC CATGCCGCTG TATGACCAGT 

25 ATGCAGCGTC CCGGAAATAT TGATGCCCCA 
ACCTTCACTG CCCACACCCA TATGCCCCGC 
CATGCAAATA CTCATTATTG GACAGGAAAA 
GGAGTCACTG TCTGTTGGAC TTACTTCACC 
CAAGATCAGG CAAGAGAAAA ACATGTAAAA 

30 GGCACCTCTA GCCCCTACAA AGGACTAGAT 
CATACTCGCC TGGTAAGCCT ATTTAATACC 
CAAAACCCTA CTAACTGTTG GATATGCCTC 
CCTGTACCTG AACT^TGGAA CAACTTCAGC 
6GACCTCTTG TTTCCAATST GGAAATAACC 

35 AGCAATACTA CATACACAAC CAACTCCCAA 
ATAGTCTGCC TACCCTCAGG AATATTTTTT 



27 



YTGCCAAGCA 


KATATTGAAG 


CMAAAAGAGC 


4320 






TATTAAACTT 


CCCTTAGTAT 


AGGGTAATCC 


4380 






AGGAGAAACA 


GAATGGGGAA 


CCTCACGAGG 


4440 






TGAAGAAGGG 


AAJVATACTTT 


TGCCTGCAAC 


4500 






TCAAACCTTT 


CACTTAGGCA 


TCGATAGCAC 


4560 






ACCAGGCCTT 


TTCA7VAACTA 


TCAAGCARAT 


4620 






TAATCCCCTG 


CCTYATCGCC 


AAGCTCCTTC 


4680 






ARAARACTGG 


C7VACTGATTT 


TACCCACAAG 


4740 






GTCTGGGTAR 


ATACTTTCAC 


GGGTTGGGCA 


4800 






CAAGAGGTAA 


TAAAGGCACT 


AGTTCATGAA 


4860 






TTACAGAGTG 


ACAATAGCCC 


TGCTTTCCAG 


4920 






TTAGGTATAC 


GATATCACTT 


ACACTGCGCC 


4980 






AAAATGAATG 


AAAYACTCAA 


AGGACATCTA 


5040 






TGGCCTGYTC 


TGTTGCCTAT 


AGCCTTAAAA 


5100 






CTTAGCCCAT 


ACGAAATGCT 


GTATGGAAGG 


5160 






CCAAGACAGC 


CAACTTAGTT 


GCA6ACATCA 


5220. 






AAACATTACA 


AGGAACCTAT 


CCCTGAGAAG 


5280 






TGGTATTAGT 


CAAGTCCCTT 


CYCTCTAATT 


5340 


v.- 


j. 


CCTACCCAGT 


CATTTTATYT 


ACCCCAACTG 


5400 






TACATCACAC 


TTGAGTCAAA 


TCCTGGATAC 


5460 






ACGCTAGCTA 


TTCCTGTGAA 


CCTCTAGAGG 


5520 






GAGGAAAGTA 


ACTAAAATCA 


TAAATCCCCC 


5580 






ASTGTTSTTT 


YACCCTSTTT 


CACTCTCACT 


5640 






AGCTCCCCTY 


ACCMAGAGTT 


TCTATGGAGA 


5700 






TCGTATAGGAG TCTTTSTAAG GGAACCCCC 


5760 






AACTGCTATC 


ACTCTGCCAC 


TCTTTGCATG 


5820 






ATGATTAATC 


CTAGTTGTCC 


TGGAGGACTT 


5880 






CAAACTGGTA 


TGTCTGATGG 


GGGTGGAGTT 


5940 






GAAGTAATCT 


CCCAACTCAC 


CSGGGTACAT 


6000 






CTCTCAAAAC 


TACATGAAAC 


CCTCCGTACC 


6060 






ACCCTCACTG 


GGCTCCATGA 


GGTCTCGGCC 


6120 






CCCCTGAACT 


TCARGCCATA 


TGTTTCAATC 


6180 






ACAGAAATAA 


ACACCACTTC 


CGTTTTAGTA 


6240 






CATACCTCAA 


ACCTCACCTG 


TGTAAAATTT 


6300 






TGCATCAGGT 


GGGTAACTCC 


TCCCACACAA 


6360 






GTCTGTGGTA 


CCTCAGCCTA 


TCGTTGTTTG 


6420 
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AATGGCTCTT CAGAATCTAT GTGCTTCCTC 
ACTGAACAAG ATTTATACAG TTATGTCATA 
CTTCCTTTTG TTATAGGAGC AGGAGTGCTA 
ACAACCTCTA CTCAGTTCTA CTACAAACTA 
5 GTCGCCGACT CCCTGGTCAC CTTGCAAGAT 
CRAAATC6AA GAGCTTTAGA CTYGCTAACC 
GGGGAAGAAT GCTGTTATTA TGTTAATCAA 
ATTCSAGATC GAATACAACG TAKAGCAGAR 
CTCAGCCRAT GGATGCCCTG GATTCTCCCC 

10 CTACTCCTCT TTGGACCCTG TATCTTTRAC 
GAAGCTGTRA AACTACAAAT GGAGCCCAAG 
CCCCTGGACC GGCCTGYTAG CCCACGATCT 
GAGGAAATCT CAGCTGCACA ACCTCTACTA 
GGTSGTCGGC CAACCTCCCC AACAGCACTT 

15 GACAGGACTA GCTGGATTTC CTAGGCTGAY 
ACCACATCCA CCTTTAAACA CGGGGCTTGC 
CTCACTAAAA TGCTAATTAG GCAAAGACAG 
MTGAGAGCAC AGCAGGAGGG ACAATGATCG 
CGGCAACCCC CTTTGGGTCC CCTCCCTTTG 

20 TCTATTAAAT CTTGCARCTG CR 



28 

TCATTCTTAG TGCCCCCYAT GRCCATCTAC 6480 
TCTAAGCCCC GCAACAAAAG AGTACCCATT 6540 
GGTGCACTAG GTACTGGCAT TGGCGGTATC 6600 
TCTCAAGAAC TAAATGGGGA CATGGAACGG 6660 
CAACTTAACT CCCTAGCAGC AGTAGTCCTT 6720 
GCTGARAGAG GGGGAACCTG TTTATTTTTA 6780 
TCCGGAATCG TCACTGAGAA AGTTRAAGAA 6840 
GAGCTTCGAA ACACTGGACC CTGGGGCCTC 6900 
TTCTTAGGAC CTCTAGCAGC TATAATATTG 6960 
CTCCTTGTTA ACTTTGTCTC TTCCAGAATC 7020 
ATGCAGTCCA AGACTAAGAT CTACCGCAGA 7080 
GATGTTAATG ACATCAAAGG CACCCCTCCT 7140 
CGCCCCAATT CAGCAGGAAG CAGTTAGAGC 7200 
AGGTTTTCCT GTTGAGATGG GGGACTGAGA 7260 
TAAGAATCCY TAAGCCTAGS TGGGAAGGTG 7320 
AACTTAGYTC ACACCTGACC AATCAGAGAG 7380 
GAGGTAAAGA AATAGCCAAT CATYTATTGC 7440 
GGATATAAAC CCAAGTYTTC GAGCCGGCAA 7500 
TATGGGAGCT CTGTTTTCAT GCTATTTCAC 7560 

7582 



(2) INFORMATIONS POUR LA SEQ ID NO: 12: 

25 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2563 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin6aire 

30 

(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 
35 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 
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ACTGCACTCT TCTGGTCCAT GTTTGTTACG GCTCGAGCTG AGCTTTTGCT CGCCATCCAC 60 

CACTGCTGTT TGCCACCGTT GCAGACCCAC TGCTGACTTC CATCCCTCTG GATCTGGCAG 120 

5 GGTGTCTGCT GTGCTCCTGA TCCAGCGAGG GGCCCATTGC CACTCCCAAT CGGGCTAAAG 180 

GCTTGCCATT GTTCCTGCAT GGCTAAGTGC CCAGGTTCAT CCTAATTGAG CTGAACACTA 240 

GTCACTGGGT TCCACAGTTC TCTTCCATGA ACCACGGCTT TTAATAGAGC TATAACACTC 300 
10 - - - 

ATCGCAAGGC CCAAGATTCC ATTCCTTGGA ATCTGTGAGG CCAAGAACCC TAGGTCAGAG 360 

AACACGAGGC TTGCCACCAT CTTGGAAGCA GCCTGCCACC ATCTGGGAAG CGGCCTGCCA 420 

? 

15 CCATCTTGGA AGCCGCCCGC CACCATCTTG GGAGCTCTGG GAGCAAGGAC CTCCCCGCAA 480 t 

CCCAGTAACA TTTAGCGACC ACGAAGGGAC CTCCAAAGCG GTAATATTGG ACCACTTTCA 540 « 

CTTGCTATTC TGTCCTATCC TTCCTTAGAA TTGGAGGAAA ATACCGGACA CCTGTCGGCC 600 

20 

GGTTAAAAAC GATTAGCGTG GCCTCCGGAC TTAAGAATCA GGTGTGAGGC TATCTGGGGA 660 

AGGGCTTTCT AACAACCCCC AACCRTTCTG GGTTGGGAAT GTTGGTCTGC CTGGAGCCAG 720 

25 CTTCCACTTT CAATTTTCCT GGGGAAGCCA AGGGCCGACT AGAGGCAGAA AGCTGTTGTC 780 

CCAAATTCCC GGCAGTAGCC GGTTGAGATC ATGGCGCAGC CAGAAGTCTT TACTCCACAG 840 

TCACCCATGC ATGCGCCCCT ATCTTTCCTT CTGACCCATA CCTCCTGGGT CCTAACCATG 900 

30 

ACTTTCTTAA AAGGGTAGCC CCAAAATTCT CCTTACCTCT GAATCTACTT CCTCTGATCC 960 

CTGCCTCCTA GGTGCTAATG GTTCAGACTT TCATTTCCTC TAGCAAGTTG TATYTCCAAA 1020 

35 GGGATATAAG GAAGCTCTAC ACTGTATCCT TAGGCATCTA GGCTCTAAAC CCAGGGAGTC 1080 



FEUILLE DE REMPLACEMENT (REGLE 26) 

BNSDCX;iD: <WO_9902eoeA1J_> 
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TTGTCCCTGA TGTCCCAACC GATTTAGGTA 
ACCCATTCCC CACCACCCTT GCCAGGGCCC 
GAGAGAGAGA GAGACAGAGT GAGACACAGA 
GGAGAGAGAC ACAGAGAGGG GAGAGACACA 
GGAGTCYMAG AGAGAGAGAA AGAAGAAGAA 
TTAAAAGCCA GGGTAAATTT AAAAAACCTA 
CCTGTAACAC TCTAATACTA CCTTGTTCTC 
CTGAGACCGC TGACACCCAT AGCTTTCCTA 
TGGCCCGCAT GCATTCAATC TGTAGTGGCA 
AGTAACTTTT AGAGGAAACC TCATTGTGAG 
TCAAAAAAGC AAAAAGGTAG CTTACTAACT 
TAGAAAAAGG TAATTTAACA CTAATCACTG 
CAGGAGATTT AAATCTTAAT TACCATACAA 
TCAGTACAGG ATGATAGATG GTTCCTCCCA 
TCAGTAATTG ATAGGGAGAC TCTTGTGGAA 
TCTCCCCAAA CCTGCGAGCT GTTTGCACTC 
AAAGATTATC TCAATCCTGA CTCAAAAGGT 
TAAGAACTGT TTATGGGACT GCATCTTGAT 
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30 

TATAGTTCTC GACATGGGCA GTTATGTGGG 1140 
CAAGTTTGTA AATGGCTAAG AGAGGAAAGT 1200 
GAGAGGGAGA GAGAGAGAGA GAGAGAGAGA 1260 
GAGAGGAGAA GGGGGCAGAG AGACCAAGAG 1320 
ATAGTAGAAA AAAAAGTGTG CCCTATTCCT 1380 
TACTTGATAA TTGAAGGTCT TCTCCATGAC 1440 
AGTGTAAACA AGGGTGTTAG CCTGAAAACA 1500 
TAAAAAATCC TTAACCCAGT AACCCGCAGA 1560 
ACTGCTTTGC TAACAAGAAT AAAGTGGAAA 1620 
CACACCTCAC CAGTTCAGAA TTATTCTAAG 1680 
CAAAAATCTT AAAGTATGGG GTTATTTTGT 1740 
ATAATTCCCT TAACCCAGAA GATTTCCTAA 1800 
AGGTCTGACC AGACCTAGGA GGAACTCCCT 1860 
GGTGAATGAA AAAAAAATCA CAATGGGTAT 1920 
GCAGAGTTAG AAAAACTGCC TAATAATTGG 1980 
AGCCAAGCCT TAAAGTACTT CTAGAATCAA 2040 
TACCTACACC CTCTGTGAAA CGAATTTACT 2100 
GGGGCAGCTG GGTTGTCATG AAATACTCAG 2160 
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GAATGCAGCC TAGCTCTAGG ACTCACCCCT GAGCACAAAG GCAATGTTGG GCATGCTGGT 2220 

AAAGGACCAC TAGAATCCAG CAGTCCGAAC CCTTTCTTTG GGTTAAGAAA GGCGGGAAAA 2280 

5 CAGGCGCAGG ACTGCTACAT TGGTAAGCGT AACTAATCCA ATAAGCAGAG GTCCATGGGT 2340 

GGTGACACAC TCTGGAAAGG AATAAGCATT AGRACCATAG AGGACGCTCT ACGACTAATG 2400 

CTCGTCGGAA AATGACTAGA GGTGCTGGCA TCCCTATGTT CTTTTTTCAG ATGGGAAATG 2460 

10 

TTCCCCCTCA AGGCAAAAAC ACCCCTAAGA TGTATTCTGG ACAATTGGGA CCAATTTGAC 2520 
CCTCAGACTC TAAGAAAGAA ACGACTTATA TTCTTCTGCA GTG 2 563 

15 

(2) INFORMATIONS POUR LA SEQ ID NO: 13: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2585 paires de bases ^ 
20 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple - - 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

25 

(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13: 
30 TCAGGGATAG CCCCCATCTA TTTGGCCAGG TATTAGCCCA AGACTTGAGC CAGTTCTCAT 60 
ACTTGGACAC TCTTGTCCTT TGGTATGTGG ATGATCTACT TTTAGCCACC TGTTCAGAAA 120 
CCTTGTGCCA TCAAGCCAAC CAAGTGCTCT TAAACTTCCT CGCCACCTGT GGCTACAAGG 180 

35 

TTTCCAAACC AGAGGCTCAG CTCTGCTTAC AGCAGGTTAA ATACTTAGGG CTAAAATTAT 240 

FEUILLE DE REMPLACEMENT (REGLE 26) 
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CCAAAGGCAC CAGGGCCCTC AGTGAGGAAC GTATCCAGCC TATACTGGCT TATCCTCATC 300 
CCAAAACCCT GAAGCAATTA AGAGGGTTCC TTGGCATAAA AGGCTGCTGT TGAATATGGA 360 

5 

TTCCCAGGTA CAATGAAATA GCCAGGCCAT TATACACACT AATTACGGGA ACTCAGAAAG 420 
CCAATACCCA TTTAGTAGAA TGGACACCTG AAGCAGAAGC GGCTTTCCAG GCCCTAAAGA 480 
10 AGGCCCTAAT CCAAGCCCCA GTGTTAAGCT TGCCAATGGA GCAAGACTTT TCTTTATATG 540 
TCACAGAAAA AAAAACAGGA ATAGCTCTAG AAGTCCTTAC ACAGGTCCGA GGGACCAGCT 600 
TACAACACAT GGCATACCTG AGTAAGGAAA CTGATGTAGT GGCAAAGGGT TGGACTCATT 660 

15 

GTTTACAGGT AGTGGCAGCA GTAGCAGTCT TAGCATCTGA AGCAGTTAAA ATGATACAGG 720 
GAAGANATCT TACTGTGTGG ACATCTCATG ATGTGAACGG CATACTCACT GCTAAAGGAG 780 
20 ACTGTGGCTG TCAGACAACC ATTTGCTTAA ATATCAGGCT CTATCACTTG AANGGCCAGT 840 
GCTGCCACTG TGCACTTGTG CAACTCTTAA CCCACCCACA TTTCTTCCAG ACAATGAAGA 900 
AAAGATAGAA CATAACTGTC AACAAGTGAT TGTTCAAACC TACACCGCTC GAAGGGACCT 960 

25 

TCTAGAGGTT CCCTTGACTG ATCCTGAGCT CAACTTCTAT ACTGATGGAA GTTCCTTTTG 1020 
TAGAAAAAGG ACTTCGAAAG GCGGGTATGC AGTGGCCAGT GATAATGGAA TACTTGAAAG 1080 
30 TAATCCCTTC ACTCCAGAAA CTAGCATTCA GCTGGCAGAA TTAATAGCCT TCACTTGGGC 1140 
ATTAGAACAC AGGAGAAGGA AAAGGACTAA ATATATATAC AGACTCCAAG TATGCTTACT 1200 
TAGTCCTCCA TGCCCATGCA GCAATATAGA GAGAAAGCGA ATTCCTAACT TCTGAGGGAA 1260 

35 

CACCTATCAA ACATCAGGAA GCCATTAGGA GATTATTACT GGCTGTACAG AAACCTAGAG 1320 

FEUILLE DE REMPLACEMENT (REGLE 26) 
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GTGGCAGTCT TACATGGCCG AGATCATCAG AAAGGAAAAG AAAGGGAAAT AGAAGGGAAC 1380 

TGCCAAGTGG ATATTGAAGC CAAAAGAGCT GCAAGGCGGG ACCCTCCATT AGAAATGCTT 1440 

5 

ATAG7VAGGAC CCCTAGTACA GGGCAATCCC CTTCAGGAAA CCAAGCCCCA ATACTCAGCA 1500 

GAAG7VAATGG AATGGGGAAC CTCATGAGGA CATAGTTTCC TCCCCTCAGG ATGGCTAGCC 15 60 

10 ACCAAAGAAG GAAAAATACT TTTGCCTGCA GCTAACCAAT GGAAATTACT TAAAACCCTT 1620 

CACCAAACCT TTCGCTTAGG CATTGATAGC ACCCATCAGA TGGCTAAATC ATTATTTACT 1680 

AGACCACACC TTTTCAAAAC TATCAAGCAG ACAGTTAGGG CCTGTGAAGT GTGCCAAAGA 1740 

15 

AATAATCCCC TGCCTTATCG CCAAACTCCT TCAGGAGAAA AAAGAACAGG CCATTACCCA 1800 ^' 

GGAGAAGAGT GGCAACTAGA TTTTACCCAC ATGCCCAAAT CTCAGGGATT TCAGTATCTA 1860 

20 CTAGTCTGGG TAGATACTTT CACTGGTTGG GCGGAGGCCT TCCCTTGTAG GACAGAACAG 1920 

GCCCATGAGG TAATAAAGGC ACTAATTCAT GAAATAATTC CCAGATTTGG ATTTCCCCAA 1980 

GGCTTACAGA GTGATAACGG CCCCACTTTC AAGGCTACAG TAACCCAGGG AGTATCCCAG 2040 

25 

ACATTAGACA TACAATATCA CTTACACTGA GCCCGGAGGC CACAATCCTC AGGAAAGTTG 2100 

AGAAAATGAA TGAAACGCTC AAATGACATC TAAAAAAGCT AACCTAAGAA ACCCACCTCT 2160 

30 CATGGTTTGC TCTGTTGCCT ATAGCCTTAG TAAGAATCCG AAACTCTCCC CAAAAAGCGG 2220 

GACTCAGCCC ATACGAAATG CTGTATGGAC GGCCCTTCCT AACCAATGAC CTTGTGCTTG 2280 



35 



ACCTAGAGAT GGCCAACTTA GTTGCAGATA TCCCTCCTTA GCCAAATATC AACAAGTTCT 2340 



TAAAACGTCA CAGGGAACCT GTCCCTGAGA GGAGGGAAAG GAATTATTCC 7WVCCTGGTGA 2400 
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CATGGTATTA GTGAAGTCCC TTCCCTCCAA CTCCCCATCC CCTGGATACA TCCTGGGAAG 2460 
GACCCTACTC AGTCATTTTA TCTATCCCAA CCGCGGTTAA AATGGCTGGA GTAGAATCTT 2520 

5 

GGATACATCA CATTCGAGTC AAACCCTAGA TACTGCCACA AGGAACCTGA AAATCCAGGA 2580 
GACAA 2585 

10 

(2) INFORMATIONS POUR LA SEQ ID NO: 14: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2575 paires de bases 
15 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

20 

(lii) HYPOTHETIQUE : NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 14: 

25 GGGATAGCCC CCATCTATTT GGCCAGGCAT TAGCCCT^GA CTTGAAGCCA ATTCTCATAC 60 

CTGGACACTC TTCTCCTTTG GTATGTGGAT GATTTACTTT TAGCTTCCTG TTCAGAAACC 120 

TTGTGCCATC AAGCCACCCA AGCACTCTTA AATTTCCTCG CTACCTGTGG CTACAAGGTT 180 

30 

TCCAAACCAA AGACCCAGCT CTGCTCACAG CAGGTTAAAT ACTTGGGGCT AAAATTATCC 240 

AAAGGCACCA GGGCCCTCAG TGAGGAACGT ATCAAGCCTA TACTGGCTTA TCCTCATCCC 300 

35 CAAATCCTAA AGCAACTAAG AGAGTTCCTT AGCATAACAG GTTTCTGCTG AATATGGATT 360 



FEUILLE DE REMPLACEMENT (REGLE 26) 

8NSDOCID: <WQ flSOgeOBAI I > 



wo 99/02696 

CCCAGGTATG GCAAAATAGC CAGACCATTA 
AATACCCATT TAGTAAGATG GATACCTGAA 
5 GCCCTAACCC AAGCCCCAGT GTTAAGCTTG 
ACAGAA7VAAA CAGGAAATAG CTCTAGGAGT 
ACCCATGGCA TACCTGAGTA AGGAAATTGA 

10 

ATGGGTAGTG GCGGCAGTAG CAGTCTTAGC 
AGATCTTACT GTGTGGACAT CTCATGATGT 
15 GTGGCTGTCA GACAACCATT TACTTAAATA 
GCAACTGCGC AGTTGTGCAG CTCTTAACCC 
AACATAACTG CCAACAAGTA ATTTCTCAAA 

20 

TTCCCTTAAC TGATCCCGAC CTCAACTTGT 
GACTTTGAAA AGTGGGGTAT GCAGTGCTCA 
25 TCATTCCAGG AACCAGCGTT CAGCTGGCAG 
TAGGAGAAGG AT^ATVAGGGTA AATACACATA 
GTGCCCACGC AGCAATATGG AGAGAAAGGG 

30 

AACATCAGGA AGTTATTAGG AGATTATTAT 
TCTTACACTG CTGGGGTGGT CAGAAAGAAA 
35 CGGATATTGA AGCCAAAAGA GCCGCAAGGC 
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TATACGCTAA TTAAGGAAAC TCAGAAAGCC 420 
GCAGAAGCAG CTTTCCAGGC CCTAAAGAGG 480 
CCAACAGGGC AAGACTTTAC TTCGTATGTC 540 
CCTTACACAA GTCTGAGGGA TGAGCTTGCA 600 
TGTAGTGGCA AAGGGTTGGC CTCATTGTTT 660 
ATCTGAAGCA GTTAAAATGA TACAGGGAAG 720 
GAATGGCATA CTCACTGCTA AAGGAGACTT 780 
TCAGGCTGTA TTACTTGAAG GGCCAGTGCA 840 
AGCCACATTT CTTCCAGACA ATGAAGATAG 900 
CCTAGGCCGC TCGAGGGAAC CTTTTAGAGG 960 
ATACTGATGG AAGTTCCTTT GTAGAAAAAG 1020 
GTGATAATGG AATACTTGAA AATAATCCCT 1080 
AATTAATAGC CCTCACTCGG GCATTAGAAT 1140 
CAGATTCTAA GTATGTTTAC TTAGTCCTCC 1200 
AATGCTTAAC TTCTGAGGGA ACACCTATCA 1260 
TGGCTATACA GAAACCTAAA GAGGTGGCAG 1320 
AGGA/^GGGA AATAAAAGGG AACTGCCAAG 1380 
AGGACCCTCC ATTAGAAATG CTTATAGAAG 1440 
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GACCCCTAGT ATGGGGTAAT CCCCTCCGGG AAACCAAGCC CCAATACTTA GAAAAAGAAA 1500 
TAGAATGGGG AACCTCACGA GGACATAGTT TCCTCCCCTC AGGATGGCTA GCCACCGAAG 1560 
5 AAGGAAAAAT ACTTTTGCCT GCAGCTAACC AATGGAAATT ACTTAAAACC CTTCACCAAA 1620 
CCTTTCACTT AGACATTGAT AGCACCCATC AGATGGCCAA ATCATTATTT ACTGGACCAG 1680 
GCCTTTTCAA AACTATCAAG CAGCTAGTCA GGGCCTGTGA AGTGTGCCGA AGAAATAATC 1740 
CCATGCCTTA TCACCAAGCT CCTTCAGGAG AACAAAGAAC AGGCCATTAC CCAGGAGAAG 1800 
RVTGGCAACT AGATTTTACC CACATGCCCA AATCTCAGGG ATTTCAGTAT CTACTAGTTT 1860 
15 GGGTAGATAC TTTCACTGGT TGGGCAGAGA CCTTCCCCTG TAAGACAGAA AAGTCCCAAG 1920 
AGGTAATAAA GGCATTAGTT CATGAAATAA TTCCCAGATT CAGACTTCCC TGAGGCTTAC 1980 
AGAGTGACAA TGGCCCTGCT TTCAAGGCTA CAGTAACCCA GGAGTATCCC AGGTGTTAGG 2040 

20 

■** TATACAATAT CACTTACACT GCGCCTGGAG GCAGTCCTCA GGGAAGGCCG AGAAACTGAA 2100 
TGAAACACTC AAAC6ACATC TAAAAAAAGC TAACCCAGGA AAACCACCTC ACATGGCCTG 2160 
25 CTCTGTTGCC TATAGCCTTA CTAAGAATCC AAAACTCTCC CCAAAAAGCA GGACTTAGCC 2220 
CATACGAAAT GCTATATGGA TAGCCCTTCC TAACCAATGA CCTTGTGCTT GACTGAGAGA 2280 
GAGCCAACTT AGTTGCAGAC ATCACCTCCT TATCCAAATA- TCAACAAGTT CTTAAAACAT 2340 

30 

TACAAGGAGC CTGTCCCCGA GAAGAGGGGA AGGAACTATT CCACCCTGGT GACATGGTAT 2400 
TAGTCAAGTC CCTTCCCTCT AATTCTCATT GCCTAGATAT ATCCTGGGAA GGACCCTACC 2460 
35 CAGTCATTTT ATCTACCCCA ACCGCAGTAA AAGTGGCTGG AGTGGAGTCT TGGATACATC 2520 
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ACACTCGAGT CAAACCCTGG ATATTACCAA AGGAACCTGA AAATCCAGGA GACAA 2 57 5 

(2) INFORMATIONS POUR LA SEQ ID NO: 15: 

5 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 783 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
10 (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

... (iii) HYPOTHETIQUE: NON 
15 ^ 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 15: 



TGAGAGACAG 


GACTAGCTGG 


ATTTCCTAGG 


CYGACTAAGA 


ATCCYTAAGC 


CTAGSTGGGA 


60 


AGGTGACCAC 


RTCCACCTTT 


AAACACGGGG 


CTTGCAACTT 


AGYTCACACC 


TGACCAATCA 


120. 


GAGAGCTCAC 


TAAAATGCTA 


ATTAGGCAAA 


GACAGGAGGT 


AAAGAAATAG 


CCAATCATYT 


180 


ATTGCMTGAG 


AGCACAGCAG 


GAGGGACAAY 


RATCGGGATA 


TAAACCCARG 


YHTTCGAGCY 


240 


GGCAACRGCA 


GMCCCCCTTT 


GGGTCCCYTC 


CCTTTGTATG 


GGAGCTCTGT 


TTTCATGCTA 


300 


TTTCACTCTA 


TTAAATCTTG 


CARCTGCRCT 


CTTCTGGTCC 


ATGTTTCTTA 


CGGCTYGAGC 


360 


TGAGCTTTYG 


CTCRCCRTCC 


ACCACTGCTG 


TTTGCCRCCA 


CCGCANACCY 


GCCGCTGACT 


420 


CCCATCCCTC 


TGGATCMTGC 


AGGGTGTCCG 


CTGTGCTCCT 


GATCCAGCGA 


RGCRCCCATT 


480 


GCCGCTCCCA 


ATYGGGCTAA 


AGGCTTGCCA 


TTGTNCCTGC 


AYGGCTAAGT 


GCCTGGGTTY 


540 


RTYCTAATTG 


AGCTGAACAC 


TANTCACTGG 


GTTCCATGGT 


TCTCTTCTGT 


GACCCACRGC 


600 


TTCTAATAGA 


RCTATAACAC 


TYACCRCATG 


GCCCAAGRTT 


CCATTCCTTG 


GAATCCRTRA 


660 


RGSCAACGAA 


CYCCASGTCA 


GAGAAYACGA 


RGCTTGCCAC 


CATCTTGGAA 


GCGGCCTGCT 


720 


ACCATCTTGG 


7VAGTGGTTCA 


CCACCATCTT 


GGGAGCTCTG 


TGAGCAAGGA 


CCCCCMRGTR 


780 


ACA 












783 



(2) INFORMATIONS POUR LA SEQ ID NO: 16: 

35 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

FEUILLE DE REIUIPLACEMENT (REGLE 26) 
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(A) LONGUEUR: 20 paires de bases 
<B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

5 

(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE : NON 
10 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO; 16: 

TGTCCGCTGT GCTCCTGATC 20 



15 (2) INFORMATIONS POUR LA SEQ ID NO: 17: 

(i> CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

2 0 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

25 (iii) HYPOTHETIQUE: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 17: 

ATGCACTCTG GCTGGGCCAA T 21 

30 

<2) INFORMATIONS POUR LA SEQ ID NO: 18: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
35 (A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 
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(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: linSaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 18: 
10 ACCATTTGAC CCTCAGACAC T 21 

(2) INFORMATIONS POUR LA SEQ ID NO: 19: 

15 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 24 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

20 

(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 
25 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 19: 

AACCCTTTGC CACTACATCA ATTT 24 



30 (2) INFORMATIONS POUR LA SEQ ID NO; 20: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

35 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: linSaire 
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10 



(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 20: 
TCAGGGATAG CCCCCATCTA T 

(2) INFORMATIONS POUR LA SEQ ID NO: 21: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 22 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 21: 
2 5 TTGTCTCCTG GATTTTCAGG TT 



15 



20 



21 



22 



30 



35 



(2) INFORMATIONS POUR LA SEQ ID NO: 22: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: linSaire 

(ii) TYPE DE MOLECULE: ADN 
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(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 22; 

5 

GGACCCTACC CAGTCATTTT 



(2) INFORMATIONS POUR LA SEQ ID NO: 23: 

10 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
15 (D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 23; 



20 



ATCAGGAGCA CA6C66ACAC 

25 

<2) INFORMATIONS POUR LA SEQ ID NO: 24: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 22 paires de bases 
30 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin6aire 



35 



(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE: NON 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 24: 
GGACATCCAA AGTGATACAT CC 22 

(2) INFORMATIONS POUR LA SEQ ID NO: 25: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
10 (A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

15 (ii) TYPE DE MOLECULE: ADN 

(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 25: 



20 



AATGTATGGC CTGAAGTGCA G 



21 



(2) INFORMATIONS POUR LA SEQ ID NO: 26: 

25 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 22 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
30 (D) CONFIGURATION: lin6aire 

(ii) TYPE DE MOLECULE: ADN 

(iii) HYPOTHETIQUE: NON 

35 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 26: 
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CTTCCCAGGA TGTATCACTT TG 



5 (2) INFORMATIONS POUR LA SEQ ID NO: 27: 

(i) CARACTERISTIQUES DE LA SEQUENCE:- 

(A) LONGUEUR: 24 paires de bases 

(B) TYPE: nucleotide 

10 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

15 (iii) HYPOTHETIQUE: NON 

(xl) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 27: 

CACTGCAGAA GAATATAAGT CGTT 

20 

(2) INFORMATIONS POUR LA SEQ ID NO: 28: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
25 (A) LONGUEUR: 21 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

30 (ii) TYPE DE MOLECULE: ADN 

(iii) HYPOTHETIQUE: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 28: 
35 GCTTCCAAGA TGGTGGCAAG C 
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(2) INFORMATIONS POUR LA SEQ ID NO: 29: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
5 (A) LONGUEUR: 678 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

10 (ii) TYPE DE MOLECULE: ADN 

(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 29: 

15 

TCAGGGATAG CCCCCATCTA TTTGGCCAGG CATTAGCCCA AGACTTGAGC CAGTTCTCAT 60 
ACCTGGATAT TCTTGTCCTT TGGTATGCGG ATGATTTACT TTTAGCCGCC CGTTCAGAAA 120 
20 CCTTGTGCCA TCAAGCCACC CAAGTGCTCT TAAATTTCCT CGCCACCTGT GGCTACAAGG 180 
TTTCCAAACC AAAGGCTCAG CTCTGCTCAC AGCAGAAGGC TATTTACCCT AAATACTTAG 240 
GGCTGAAATT ATCCAAAGGC ACCAGGGCCC TCAGTGAGGA ATGTATCCAG CCTATACTGG 300 

25 

CTTATCCTTA TCCCAAAACC CTAAAACAAC TAAGAAGGTT CCTTGGCATA ATAGGCATAA 360 
CAGGCATAAC AGGTTTCTGC TGAATATGGA TTCCCAAGTA CGGCAAAATA GCCAGACCAT 420 
3 0 TATATACACT AATTAAGGAA ACTCAGAAAG CCAATACCCA TTTAGTAAGA TGGACACCTG 480 
AAGCAGAGGC AGCTTTCCAG GCCGTAAAGA ACACCCTAAC CCAAGCCCCA GTGTTAAGCT 540 
TGCCAGCGGG GCAAGACTTT TCTTTCTGTG TCACAGAAAA AATAGGAATA GCTNTAGGAG 600 

35 

TCCTTACACA GGTCCGAGGG ACCAGCTTGC AACCCATGGC ATACCTGAGT AAGGAAATTG 660 
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ATGTAGTGGC AAAGGGTT 678 

5 (2) INFORMATIONS POUR LA SEQ ID NO: 30: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 53 6 paires de bases 
(B> TYPE: nucleotide 
10 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: linSaire 

(ii) TYPE DE MOLECULE: ADN 

15 (iii) HYPOTHETIQUE: NOW 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 30: 

CCAATCTCCA TGTTGTATCC CCTTCCCCAA CTAATAAGGA CCCCCCTTTC AACCCAAACA 60 

20 

GTCCA7UVAGG ACATAGACAA AGGAGTAAAC AATGAACCAA AGAGTGCCAA TATTCCCTGG 120 
TTATGCACCC TCCAAGCGGT GGGAGAAGAA TTCGGCCCAG CCAGAGTGCA TGTACCTTTT 180 
25 TCTCTCTCAC ACTTGAAGCA AATTAAAATA GACCTAGGTA AATTCTCAGA TAGCCCTGAT 240 
GGCTATATTG ATGTTTTACA AGGATTAG6A CAATCCTTTG ATCTGACATG GAGAGATATA 300 
ATATTACTGC TAAATCAGAC GCTAACCTCA AATGAGAGAA GTGCTGCCAT AACTGGAGCC 360 

30 

CGAGAGTTTG GCAATCTCTG GTATCTCAGT CAGGTCAATG ATAGGATGAC AACGGAGGAA 420 
AGAGAACGAT TCCCCACAGG GCAGCAGGCA GTTCCCAGTG TAGCTCCTCA TTGGGACACA 480 
35 GAATCAGAAC ATGGAGATTG GTGCCGCAGA CATTTAAAGC TTTCCCCGGG TACCGA S36 
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(2) INFORMATIONS POUR LA SEQ ID NO: 31: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
5 (A) LONGUEUR: 591 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

10 (ii) TYPE DE MOLECULE: ADN 

(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 31: 

15 

CCATGGCCAT CTACACTGAA CAAGATTTAT ACAATCATGT CGTACCTAAG CCCCACAACA 60 
AAAGAGTACC CATTCTTCCT TTTGTTATCA GAGCAGGAGT GCTAGGCAGA CTAGGTACTG 120 
2 0 GCATTGGCAG TATCACAACC TCTACTCAGT TCTACTACAA ACTATCTCAA GAAATAAATG 180 
GTGACATGGA ACAGGTCACT GACTCCCTGG TCACCTTGCA AGATCAACTT AACTCCCTAG 240 
CAGCAGTAGT CCTTCAAAAT CGAAGAGCTT TAGACTTGCT AACCGCCAAA AGAGGGGGAA 300 

25 

CCTGTTTATT TTTAGGAGAA GAACGCTGTT ATTATGTTAA TCAATCCAGA ATTGTCACTG 360 
AGAAAGTTAA AGAAATTCGA GATCGAATAC AATGTAGAGC AGAGGAGCTT CAAAACACCG 420 
30 AACGCTGGGG CCTCCTCAGC CAATGGATGC CCTGGGTTCT CCCCTTCTTA GGACCTCTAG 480 
CAGCTCTAAT ATTGTTACTC CTCTTTGGAC CCTGTATCTT TAACCTCCTT GTTAAGTTTG 540 
TCTCTTCCAG AATTGAAGCT GTAAAGCTAC AGATGGTCTT ACAAATCTAG A 591 

35 



BNSCOCID: <WO_9902e9eA1J_> 



FEUILLE DE REMPLACEMENT (REGLE 26) 



PCT/FR98/01442 



47 

(2) INFORMATIONS POUR LA SEQ ID NO: 32: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 364 paires de bases 
5 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS; simple 

(D) CONFIGURATION: lineaire 



10 



(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE : NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 32: 
15 CTAACCTGAG GATCCAGCAG CAGGACTGAG GGTGCCCGGG GCAAGTGCCA GCCCATGCCA 60 

jf.. .J.. 

TCACCCTCAG AGCCCCGGGT ATGTTTGACC ATTGAGAGCC AGGAAGTTAA CTGTCTCCTG 120 

GACACTGGCG CAGCCTTCTC AGTCTTACTT TCCTGTCCCA GACAATTGTC CTCCAGATCT 180 

20 

GTCACTATCC GAGGGGTCCT AGGACAGCCA GTCACTACAT ACTTCTCTCA GCCACTAAGT 240 

TGTGACTGGG GAACTTTACT CTTTTCACAT GCTTTTCTAA TTATGCCTGA AAGCCCCACT 300 

25 CCCTTGTTAG GGAGAGACAT TTTAGCAAAA GCAGGGGCCA TTATACACCT GAACAAGCTT 360 

GAAA 364 



30 (2) INFORMATIONS POUR LA SEQ ID NO: 33: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 538 acides amines 

(B) TYPE: acide amine 

35 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE: proteine 
(iii) HYPOTHETIQUE : NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 33: 

Met Gly Leu Pro Tyr His lie Phe Leu Cys Ser Val Leu Ser Pro Cys 
15 10 15 

Phe Thr Leu Thr Ala Pro Pro Pro Cys Arg Cys Met Thr Ser Ser Ser 
20 25 30 

Pro His Pro Glu Phe Leu Trp Arg Met Gin Arg Pro Gly Asn lie Asp 
15 35 40 45 

Ala Pro Ser Tyr Arg Ser Leu Ser Lys Gly Thr Pro Thr Phe Thr Ala 
50 55 60 



10 



20 



25 



His Thr His Met Pro Arg Asn Cys Tyr His Ser Ala Thr Leu Cys Met 
65 70 75 80 

His Ala Asn Thr His Tyr Trp Thr Gly Lys Met lie Asn Pro Ser Cys 

85 90 95 

Pro Gly Gly Leu Gly Val Thr Val Cys Trp Thr Tyr Phe Thr Gin Thr 

100 105 110 



Gly Met Ser Asp Gly Gly Gly Val Gin Asp Gin Ala Arg Glu Lys His 
30 115 120 125 

Val Lys Glu Val lie Ser Gin Leu Thr Gly Val His Gly Thr Ser Ser 
130 135 140 

35 Pro Tyr Lys Gly Leu Asp Leu Ser Lys Leu His Glu Thr Leu Arg Thr 

145 150 155 160 
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His Thr Arg Leu Val Ser Leu Phe Asn Thr Thr Leu Thr Gly Leu His 
165 170 175 

Glu Val Ser Ala Gin Asn Pro Thr Asn Cys Trp He Cys Leu Pro Leu 
180 185 190 

Asn Phe Arg Pro Tyr Val Ser He Pro Val Pro Glu Gin Trp Asn Asn 
195 200 205 

Phe Ser Thr Glu He Asn Thr Thr Ser Val Leu Val Gly Pro Leu Val 
210 215 220 

Ser Asn Val Glu He Thr His Thr Ser Asn Leu Thr Cys Val Lys Phe 
15 225 230 235 240 

Ser Asn Thr Thr Tyr Thr Thr Asn Ser Gin Cys He Arg Trp Val Thr 
245 250 255 

20 Pro Pro Thr Gin He Val Cys Leu Pro Ser Gly He Phe Phe Val Cys 

260 265 270 

Gly Thr Ser Ala Tyr Arg Cys Leu Asn Gly Ser Ser Glu Ser Met Cys 
275 280 285 

25 

Phe Leu Ser Phe Leu Val Pro Pro Met Thr He Tyr Thr Glu Gin Asp 
290 295 300 

Leu Tyr Ser Tyr Val He Ser Lys Pro Arg Asn Lys Arg Val Pro He 
30 305 310 315 320 

Leu Pro Phe Val He Gly Ala Gly Val Leu Gly Ala Leu Gly Thr Gly 
325 330 335 

35 He Gly Gly He Thr Thr Ser Thr Gin Phe Tyr Tyr Lys Leu Ser Gin 

340 345 350 
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Glu Leu Asn Gly Asp Met Glu Arg Val Ala Asp Ser Leu Val Thr Leu 
355 360 365 - 

Gin Asp Gin Leu Asn Ser Leu Ala Ala Val Val Leu Arg Asn Arg Arg 
370 375 380 

Ala Leu Asp Leu Leu Thr Ala Glu Arg Gly Gly Thr Cys Leu Phe Leu 
385 390 395 400 

Gly Glu Glu Cys Cys Tyr Tyr Val Asn Gin Ser Gly He Val Thr Glu 
405 410 415 

Lys Val Glu Glu lie Pro Asp Arg He Gin Arg He Ala Glu Glu Leu 
15 420 425 430 

Arg Asn Thr Gly Pro Trp Gly Leu Leu Ser Arg Trp Met Pro Trp He 
435 440 445 

20 Leu Pro Phe Leu Gly Pro Leu Ala Ala He He Leu Leu Leu Leu Phe 

450 455 460 

Gly Pro Cys He Phe Asp Leu Leu Val Asn Phe Val Ser Ser Arg He 
465 470 475 480 

25 

Glu Ala Val Lys Leu Gin Met Glu Pro Lys Met Gin Ser Lys Thr Lys 
485 490 495 

He Tyr Arg Arg Pro Leu Asp Arg Pro Ala Ser Pro Arg ser Asp Val 
30 500 505 510 

Asn Asp He Lys Gly Thr Pro Pro Glu Glu He Ser Ala Ala Gin Pro 
515 520 525 

35 Leu Leu Arg Pro Asn Ser Ala Gly Ser Ser 

530 535 
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(2) INFORMATIONS POUR LA SEQ ID NO: 34: 



5 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 52 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 

10 

(ii) TYPE DE MOLECULE: peptide 



(iii) HYPOTHETIQUE : NON 



15 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 34: 

Met Glu Pro Lys Met Gin Ser Lys Thr Lys lie Tyr Arg Arg Pro Leu 
15 .10 15 . 

2 0 Asp Arg Pro Ala Ser Pro Arg Ser Asp Val Asn Asp lie Lys Gly Thr 

20 25 30 



Pro Pro Glu Glu lie Ser Ala Ala Gin Pro Leu Leu Arg Pro Asn Ser 
35 40 45 

25 

Ala Gly Ser Ser 
50 



30 (2) INFORMATIONS POUR LA SEQ ID NO: 35: 



(1) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 48 acides amines 

(B) TYPE: acide amin6 

35 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 
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52 

(ii) TYPE DE MOLECULE: peptide 
(iii) HYPOTHETIQUE: NON 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 35: 

Met Leu Met Thr Ser Lys Ala Pro Leu Leu Arg Lys Ser Gin Leu His 
15 10 15 

Asn Leu Tyr Tyr Ala Pro lie Gin Gin Glu Ala Val Arg Ala Val Val 
20 25 30 



Gly Gin Pro Pro Gin Gin His Leu Gly Phe Pro Val Glu Met Gly Asp 
15 35 40 45 



10 
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